讓火車頭采集器只采集第一張圖片的解決方法

火車頭采集器是一款比較強大的采集工具,很多站長也都在使用,金華也不例外。最近金華在使用這個采集器的時候,碰上一個問題,網上搜索了很久之后都找不到答案,問了群里的朋友、官方的客服,都沒有得到解決,SO,自己動手,豐衣足食!

目標:只采集第一頁第一張圖片

由于要采集的目標站點喜歡將一篇文章分成很多頁,每一頁又單獨配了一張圖片。我們采集的時候經常會連同內容當中所有的圖片都采集下來,但是像我碰上的這個情況,又只是希望只采集第一頁的第一張圖片,其它分頁的圖片不想采集。這樣做的好處是既可以節約空間,又可以組織更多的有用的文字內容展現給用戶。

實現過程:

在昆哥的幫助下,終于找到一種解決方法,雖然不算完美,但至少在當前能解決這個問題

1、在任務的第二步:頁面內容標簽定義? 這里增加一個新的標簽,命名為圖片,如下圖

2、在圖片標簽中過濾出自己要的圖片代碼,通常是帶<img alt=”” src=”” />這種格式,請不要在此標簽中勾選:該標簽在分頁中使用,這樣就只會采集第一張圖片

3、在內容標簽中將圖片過濾,這里不要勾選下載圖片

4、在發布模塊中的body當中增加一個參數,如:body=[標簽:圖片][標簽:內容]&,默認body當中只有內容標簽,所以我們將我們新增的圖片標簽加到body當中去,在我們發布文章時將會直接將采集到的第一張圖片發布到內容中去。

通過這樣的方式,可以達到我們只采集第一張圖片的功能。

目前對于這個小功能的建議已經提交給火車頭官方了,希望在新版V7當中能夠加上,使得火車頭更人性化。

火車頭是一個強大的工具,我們做網站不可能所有的內容都原創,適當的用好采集將會使你的網站更快的豐富起來。不建議純采集,如谷歌站長指南當中所說的一樣,一定要加上對用戶有用的內容,體現出你網站的特色,避免被搜索引擎當作重復內容來處理。

未經允許不得轉載:鄺金華博客 » 讓火車頭采集器只采集第一張圖片的解決方法

贊 (0)
广西快三走势图一定牛 赛车pk10人工计划 十一运前三直走势图 今天股票上证指数 皇家88平台登录注册 欧冠射手榜历史排名 襄阳卡五星麻将免费 权重股排名50 正规网上棋牌 短线股票交易秘诀 喜乐福彩app