分类分类
更新时间:2026-05-11 03:32:39作者:yezheng
采集有的站点,同样的标题会出现两次,出现这个问题主要是链接标记没有设置好.比如某个文章列表的代码是这样的:
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090813/000011.htm">决定胎儿大小的6个疑问(图)</a>[<a href="/a/20090813/000011.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">13日09:47</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090812/000004.htm">孕时妊娠反应大 宝宝更聪明</a>[<a href="/a/20090812/000004.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">12日09:31</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090811/000003.htm">怀了双胞胎应该注意些什么?</a>[<a href="/a/20090811/000003.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">11日09:29</td>
</tr>
如果链接开始和结束标记设置为:
链接开始标记:href="
链接结束标记:"
得到的文章列表Url就会有重复,因为这里每篇文章除了标题有链接外,标题后还有个"详细"也有链接,所以正确的链接开始和结束标记设置为:
链接开始标记:class="fontbrown nl" href="
链接结束标记:"
也就是说链接前后多截取一点字符,保证链接的唯一性
相关
修真情缘角色扮演303.33 MBv1.0.02026-05-10
下载我的小独角兽女孩休闲益智380.89 MBv1.0.232026-05-10
下载超级种田男孩手机版经营养成1.31Gv1.0.92026-05-10
下载不必要的实验冒险游戏64.9 MBv1.1.592026-05-10
下载军师联盟策略游戏163.2 MBv0.0.12026-05-10
下载翻天喜地凑大钱手机版休闲益智138.72 MBv1.0.92026-05-10
下载东离剑游纪手游动作射击1.6Gv1.4.22026-05-10
下载天猫养车商家版App学习办公74.95 MBv0.6.12026-05-10
下载掌上命运方舟App手游辅助137.48 MBv1.9.12026-05-10
下载退役军人服务APP生活服务67.16 MBv1.2.52026-05-10
下载屯漫漫画APP资讯阅读23.06 MBv2.0.32026-05-10
下载蛋仔派对蛋壳App手游辅助185.73 MBv0.0.22026-05-10
下载









