97免费在线观看视频 I 午夜夫妻视频 I 久久久久久网站 I 天堂网男人 I 欧美大波大乳人奶 I 丝袜 中出 制服 人妻 美腿 I 窝窝午夜理论片影院 I 日韩在线伦理电影 I 韩国特级毛片 I 亚洲欧美另类激情 I 在线成人日韩 I 麻豆视频免费看 I 黄色生活毛片 I 极品一线天小嫩嫩真紧 I 色久天堂 I 久久久久久黄色片 I 林智妍三级露全乳电影视频 I 大肉大捧一进一出好爽视频 I 空乘伦理hd I 少妇口述与子做过爱 I 成人免费影片 I 国产精品国内免费一区二区三区 I 日韩制服一区 I 青青草福利在线 I 日本在线观看不卡视频 I 婷婷六月综合亚洲 I 国产又粗又黄又硬 I 美女扒开屁股让男子桶爽 I 欧美性午夜视频观看 I 欧美狠狠插 I 亚洲福利在线观看视频 I 无码抽搐高潮喷水流白浆 I 亚洲欧美国产日韩色伦 I 你懂的视频网站在线观看 I www.蜜桃视频在线观看 I 日本无码人妻精品一区二区蜜桃 I 久久中文字幕人妻丝袜 I 碰草在线视频 I 日韩精品成人av网站

網(wǎng)頁切片的網(wǎng)頁對象

2012/3/23 14:15:43   閱讀:3095    發(fā)布者:3095

 一種面向搜索引擎的網(wǎng)頁分塊、切片的原理,實現(xiàn)和演示,跟著工作的深入,是我研究網(wǎng)頁切片算法的一個匯總想法主意。歸結(jié)到90度和0度上去,得到一個條塊分割的矢量圖。這段時間對算法的一個體會就是,算法就是解決特定題目的方法。

假如處理分頁的內(nèi)容型網(wǎng)頁:

  從切片的粒度可以看出,應該把內(nèi)容區(qū)作為一個部門單獨切出來,好的辦法只有一個,模擬鼠標擊鍵,擊鍵處的對象返回響應,這在IE能夠?qū)崿F(xiàn)的。干嗎要分析HTML呢?情況多得很,根天職析不外來。視覺分析只能落腳到視覺上,只能對頁面的靜態(tài)畫面作分析才能得到準確的條塊分割,分割條塊是輕易的簡樸算法就能做到,但是要把這些內(nèi)容歸結(jié)到分割到的條塊是難的。看他怎么分析。對不同網(wǎng)頁,應該有個識別算法,應該包括哪些尺度?

  就拿最簡單的,我有一個類似于OutLook工具條的頁面風格,都是腳本生成的,我看他怎么分析!況且,現(xiàn)在依賴客戶端腳本展現(xiàn)動態(tài)表現(xiàn)力慢慢開始流行,這個算法很難適應未來的潮流。教科書上的算法大都是最一般性,常用性的方法的說明。

  我怎么想都覺得我的簡單算法都要比文中的算法強多了。但能把我們解決的標題題目用數(shù)學模型表達出來仍是一個不斷提高算法水平的基本要求。然后作模糊處理,然后用一個亮度閾值把圖片轉(zhuǎn)換成二值圖,然后作一個矢量化處理,留下線條。

  我那天用浮動的 用絕對位置定位代替 定位,并且在客戶端的JavaScript中動態(tài)排列。我目前的進展是:可以識別 導航區(qū)、鏈接區(qū)、頁腳區(qū)。可是實現(xiàn)起來有許多障礙,現(xiàn)在大多數(shù)網(wǎng)站為了改善用戶體驗和增加頁面展示次數(shù)的需要,對網(wǎng)頁做了分頁處理,這部分需要設別出來。

  互連網(wǎng)紗功能的網(wǎng)頁大概有2種類型,目錄型和內(nèi)容型;隨著搜索引擎的發(fā)展,網(wǎng)站結(jié)構(gòu)逐漸向扁平化的方向發(fā)展,車東 對此也做出了數(shù)據(jù)驗證,而且隨著顯示器分辨率的不斷提高,內(nèi)容和目錄結(jié)合型的網(wǎng)頁呈增加趨勢,天極的網(wǎng)頁涉及,可以說是其中的典范。客戶端的對象用腳本動態(tài)生成插入。

網(wǎng)頁內(nèi)容區(qū)最大范圍識別:
無意間看到了:VIPS:基于視覺的Web頁面分頁算法 ,從理論上證實了這種方法的可行性。網(wǎng)頁切片算法的對象應該是針對:內(nèi)容型和內(nèi)容目錄混合型。然后,每一塊中按照密度用鼠標點擊模擬獲得對象!這樣就可以完成了條塊歸納了。

網(wǎng)頁切片的網(wǎng)頁對象:

視覺依賴畫面分割條塊,很簡樸,對空缺進行膨脹-縮小算法,這樣留白就能逐漸清楚出來,文字就恍惚了。
套句俗話,能解決實際題目的方法就是好方法。
這樣的算法太依靠于詳細實現(xiàn)了,很難有好的解決辦法。
網(wǎng)頁切片算法的目的不是精確找到所需要的內(nèi)容,而是識別劃分網(wǎng)頁的各種功能區(qū)域,導航區(qū),鏈接區(qū),內(nèi)容,頁腳區(qū)和廣告區(qū)等。
對內(nèi)容區(qū)的分析是個難點,鑒于我自己的需要,只要找到最大的內(nèi)容區(qū)就可以了。這樣才能取得分割好條塊后的對象歸屬。根據(jù)一般的網(wǎng)頁設計規(guī)律,一般有2種容納內(nèi)容區(qū)的方式:1、包含型(如blog ) 2、并列型(如bbs帖子)。