-
Notifications
You must be signed in to change notification settings - Fork 11
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Bug: 专栏解析 API 调用出错:list index out of range #228
Comments
无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控? |
我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"] |
我这里怎么刷新都是有的,而且使用 inprivate 模式也能稳定存在,尝试修改为移动端 edge 的 UI 也可稳定存在 |
这个是正常的,不正常的是开头是图片的 |
已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 |
辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下 |
此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响 |
就像我之前说的,文字不是在开头出现的就没有read-article-holder,如果后面的文字使用其他xpath去匹配的那没问题了 |
操作系统
Windows
Python 版本
3.12
NoneBot 版本
2.0
Bilichat 版本
latest
描述问题
随便找了几个专栏试了一下,似乎就是专栏开头是文字的可以解析,但是开头是图片的解析不了
这个就是不行的
https://www.bilibili.com/read/cv35721905/
这个可以
https://www.bilibili.com/read/cv34697133/
不行的F12看网页的确是搜不到这个
//div[@id="read-article-holder"]
插件的配置项
No response
截图或日志
No response
The text was updated successfully, but these errors were encountered: