快捷导航
        主题名有两个,这两个主题都是干的同一件事情,【182tv】,【182tv】午夜福利价格信息,然而均以失败告终:
        (主题1)AMAZON_PRI
        这个主题定义了一个规则,【182tv】,【182tv】午夜福利96个数据,然而失败了86个
        如下图所示

        请问 如何才能不失败呢?


        (主题2):amazon_price0824

        这个主题定义了3个规则,但是仍然有30个是失败的,请问如何处理?
        举报 使用道具
        | 回复

        共 8 个关于本帖的回复 最后回复于 2019-8-30 09:22

        沙发
        Fuller 管理员 发表于 2019-8-28 14:56:43 | 只看该作者


        给最顶层的容器节点也做一个定位标志映射,然后点“测试”按钮,看生成的规则,就能发现每个【182tv】视频内容的xpath简单了很多。这样适应性就会高很多
        举报 使用道具
        板凳
        Fuller 管理员 发表于 2019-8-28 14:57:53 | 只看该作者
        如果还有失败的线索,可以参照这个帖子,可以利用线索号,或者网址,加载分析失败线索: https://www.gooseeker.com/doc/thread-13085-1-1.html
        举报 使用道具
        地板
        18042659925 中级会员 发表于 2019-8-29 13:04:36 | 只看该作者
        Fuller 发表于 2019-8-28 14:56
        给最顶层的容器节点也做一个定位标志映射,然后点“测试”按钮,看生成的规则,就能发现每个【182tv】视频内容的xp ...

        按照这个方法全都失败了
        举报 使用道具
        5#
        18042659925 中级会员 发表于 2019-8-29 13:14:30 | 只看该作者
        Fuller 发表于 2019-8-28 14:57
        如果还有失败的线索,可以参照这个帖子,可以利用线索号,或者网址,加载分析失败线索: https://www.goose ...


        举报 使用道具
        6#
        18042659925 中级会员 发表于 2019-8-29 13:29:15 | 只看该作者
        Fuller 发表于 2019-8-28 14:57
        如果还有失败的线索,可以参照这个帖子,可以利用线索号,或者网址,加载分析失败线索: https://www.goose ...

        AMAZON_PRI


        可以帮我看看 究竟是哪里出了问题么?
        举报 使用道具
        7#
        Fuller 管理员 发表于 2019-8-29 14:56:40 | 只看该作者

        我加载和分析你的规则是成功的,是不是用到其他网址就失败了?发出来一个失败网址我套用一下试试
        举报 使用道具
        8#
        18042659925 中级会员 发表于 2019-8-29 19:20:26 | 只看该作者
        Fuller 发表于 2019-8-29 14:56
        我加载和分析你的规则是成功的,是不是用到其他网址就失败了?发出来一个失败网址我套用一下试试
        ...

        https://www.amazon.cn/鱼王-维克托·阿斯塔菲耶夫/dp/B06Y63SW4F/ref=cm_cr_arp_d_product_top?ie=UTF8
        举报 使用道具
        9#
        Fuller 管理员 发表于 2019-8-30 09:22:43 | 只看该作者
        18042659925 发表于 2019-8-29 19:20
        https://www.amazon.cn/鱼王-维克托·阿斯塔菲耶夫/dp/B06Y63SW4F/ref=cm_cr_arp_d_product_top?ie=UTF8
        ...

        可以这样操作:
        1,先把规则加载到工作台上
        2,把这个失败网址输入到地址栏
        3,等网页显示出来,选择菜单 规则-》刷新页面结构,再选择 规则-》分析页面
        4,你会发现,0,1,6号【182tv】视频内容没有匹配上。

        0号是顶层的容器节点,先不用管,因为内容定位上以后容器节点自然就定位上了。

        对比两个网页,发现在字体和颜色等方面有很大不同。集搜客浏览器是可以打开多个页面的,可以对比着做规则。

        看下图,标题字体不一样,所幸在这个html节点上面还有一个父节点,他们的id是一样的,那么选择这个节点做定位标志映射,这样就找到共同点了。内容映射也用这个节点


        再看价格,底色不一样,也是能找到共同点,看红框那个id,是相同的,为了防止【182tv】视频到不需要的内容,用这个节点做定位标志映射,但是内容映射还是精确到下面的只包含价格内容的那个节点。

        举报 使用道具
        您需要登录后才可以回帖 登录 | 立即注册

        精彩推荐

        • 如何使用集搜客分词平台做社会网络图分析?
        • 关于食品安全的美国联邦法规文件的网络爬虫
        • 怎样更有效率地搜索互联网和整理知识—使用
        • 阿里巴巴外包询价网站用集搜客网络爬虫能采
        • 在限定论域的时候,为什么“任何一个”表示

        热门用户

        GMT+8, 2020-5-25 09:16