台灣最大程式設計社群網站
線上人數
1798
 
會員總數:246050
討論主題:189633
歡迎您免費加入會員
討論區列表 >> PHP >> 抓取網頁目前網址問題
[]  
[我要回覆]
1
回應主題 加入我的關注話題 檢舉此篇討論 將提問者加入個人黑名單
抓取網頁目前網址問題
價值 : 50 QP  點閱數:652 回應數:3
樓主

迷路
高級專家
11226 137
7561 1743
發送站內信

捐贈 VP 給 迷路
在網站的所有網頁中加入一段公用函數

用來紀錄網站瀏覽人數,並且同時記錄下訪客的第一個瀏覽頁面和來源網址
但是記錄下一些奇怪的紀錄想請問一下

例如說第一個訪問頁面網址($url)
http://www.xxx.com.tw/index.php/rent-a-bump-gun/function.include-onceid=Lkjae6FANtt%BA%E5%8C%BAlEWQDEhU8KyEsNwgxFVRECAQoAmEsEisVJFddAwUfIT4ueyRccAIbFBxAOCoOe4VzK1gnFSMXHCoudkgpCScaOyFXIlQZGiQcfxMfNVNoLlAoVkIybAJSKFwUQkVCeEVXdQYUQy5GbBxSdAgE6%B3%B5_%E4%B8%8A%E6%B5%B7%E6%8E%92%E6%B1%A1%E6%B3%B5__%E6%97%A0%E5%A0%B5%E5%A1%9E%E7%AE%A1%E9%81%93%E6%8E%92%E6%B1%A1%E6%B3%B5_gw%E7%AE%A1%E9%81%93%E6%8E%92%E6%B1%A1%E6%B3%B5_gw%E7%AE%A1%E9%81%93%E6%B3%B5&space=C2%82%C3%82%C2%83%C3%83%C2%83%C3%82%C2%82%C
可是實際上不但網站沒有這個頁面,更重要的是網站的網址結構也不是這種型式的
或是第一個訪問頁面網址($url)不是網站網址的
http://BXX/
甚至是第一個訪問頁面網址($url)空白的
http:///

請問以上的情況是否為網站遭駭客測試攻擊或是被軟體砍站

本篇文章發表於2015-03-09 14:46
1樓
最有價值解答

浩瀚星空
捐贈 VP 給 浩瀚星空 檢舉此回應
一般來說,這大多是一些搜尋站砍站的模式。
第一種常常的。可能就是所謂的火車頭資料取得程式。
第二種跟第三種就有可能是偽裝的節錄資料用的程式。也就是非透過瀏覽器來取得的。
本篇文章回覆於2015-03-11 23:24
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
2樓
作者回應

迷路
捐贈 VP 給 迷路 檢舉此回應
感謝星空大的回覆
再請問一下「火車頭資料取得程式」有甚麼介紹網頁可供參考嗎?
或是用甚麼樣的關鍵字比較容易搜尋到相關頁面?
直接用「火車頭資料取得程式」搜尋到的都是不相關的網頁
本篇文章回覆於2015-03-12 09:51
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
3樓
回應

浩瀚星空
捐贈 VP 給 浩瀚星空 檢舉此回應
火車頭是一種抓網頁資源用的程式。有分程式跟網頁式的。
為何叫火車頭。就是你得設定一些關鍵字,也就是一開始的火車。
設定完後。它會自動先從搜尋站找出相關網站後。再一個一個將頁面節錄下來。
變得像是一直掛車箱一樣一節一節的增加。
掛多了之後。自然就會出現不知所謂的站出現。

一般會這樣的做法有分以下的可能性。
一種是為了讓網站的內容更多。一種只是為了讓網站的爆光度增加。
其實所謂的垃圾站大多就是利用這樣的模式。這樣可以增加br值。讓某個網址更有價值。

不過目前對google來說。已經有在排除這一類的站。
所以在google上搜尋會比較不太容易碰上垃圾站。但如在像百度之類的。
有時你常會找到一些不知所謂的站。很難找資料。這就是這些垃圾站害的。

你想要找這一類的程式,其實往大陸的一些相關站都可以找到。因為我很排斥這東西。
所以我並沒有去保留這些程式。
本篇文章回覆於2015-03-12 16:40
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
   
1

回覆
如要回應,請先登入.