分类分类
更新时间:2026-03-29 04:29:25作者:yezheng
采集有的站点,同样的标题会出现两次,出现这个问题主要是链接标记没有设置好.比如某个文章列表的代码是这样的:
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090813/000011.htm">决定胎儿大小的6个疑问(图)</a>[<a href="/a/20090813/000011.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">13日09:47</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090812/000004.htm">孕时妊娠反应大 宝宝更聪明</a>[<a href="/a/20090812/000004.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">12日09:31</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090811/000003.htm">怀了双胞胎应该注意些什么?</a>[<a href="/a/20090811/000003.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">11日09:29</td>
</tr>
如果链接开始和结束标记设置为:
链接开始标记:href="
链接结束标记:"
得到的文章列表Url就会有重复,因为这里每篇文章除了标题有链接外,标题后还有个"详细"也有链接,所以正确的链接开始和结束标记设置为:
链接开始标记:class="fontbrown nl" href="
链接结束标记:"
也就是说链接前后多截取一点字符,保证链接的唯一性
相关
王道三国策略游戏380.18 MBv0.0.12026-03-28
下载刮个爽手机版休闲益智186.96 MBv1.0.282026-03-28
下载龙符天祭策略游戏756.03 Mv22026-03-28
下载入魂一番赏app网上购物106.66 Mv4.3.52026-03-28
下载童话师经营养成504.02 Mv1.1.52026-03-28
下载Bebo Cam app图像拍照264.51 Mv2.3.02026-03-28
下载纯三国官方正版策略游戏167.24 Mv0.0.12026-03-28
下载Poka Cam app图像拍照74.7 Mv1.8.02026-03-28
下载COLMO app趣味娱乐199.15 Mv2.3.5.22026-03-28
下载愤怒的小鸟变形金刚苹果版休闲游戏439.4 Mv2.39.02026-03-28
下载这也能切苹果版休闲游戏479.6 Mv21342026-03-28
下载口袋吉伊卡哇苹果手机版模拟游戏920.4 Mv2.0.02026-03-28
下载










