Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bug: 专栏解析 API 调用出错:list index out of range #228

Closed
DreamGallery opened this issue Jul 7, 2024 · 10 comments · Fixed by #229
Closed

Bug: 专栏解析 API 调用出错:list index out of range #228

DreamGallery opened this issue Jul 7, 2024 · 10 comments · Fixed by #229
Labels
bug Something isn't working question Further information is requested

Comments

@DreamGallery
Copy link

操作系统

Windows

Python 版本

3.12

NoneBot 版本

2.0

Bilichat 版本

latest

描述问题

随便找了几个专栏试了一下,似乎就是专栏开头是文字的可以解析,但是开头是图片的解析不了
这个就是不行的
https://www.bilibili.com/read/cv35721905/
image
这个可以
https://www.bilibili.com/read/cv34697133/
image

不行的F12看网页的确是搜不到这个//div[@id="read-article-holder"]

插件的配置项

No response

截图或日志

No response

@DreamGallery DreamGallery added the bug Something isn't working label Jul 7, 2024
@Well2333
Copy link
Owner

Well2333 commented Jul 8, 2024

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

@Well2333 Well2333 added the question Further information is requested label Jul 8, 2024
@DreamGallery
Copy link
Author

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

@DreamGallery
Copy link
Author

image
image

@Well2333
Copy link
Owner

Well2333 commented Jul 8, 2024

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

我这里怎么刷新都是有的,而且使用 inprivate 模式也能稳定存在,尝试修改为移动端 edge 的 UI 也可稳定存在

@Well2333
Copy link
Owner

Well2333 commented Jul 8, 2024

image

@DreamGallery
Copy link
Author

DreamGallery commented Jul 8, 2024

image

这个是正常的,不正常的是开头是图片的
https://www.bilibili.com/read/cv35721905
试过几个其他的也是一样
比如这个开头是图片也是不行的
https://www.bilibili.com/read/cv35967927

@Well2333
Copy link
Owner

Well2333 commented Jul 8, 2024

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。
此问题将在下个版本修复。

@DreamGallery
Copy link
Author

DreamGallery commented Jul 8, 2024

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

@Well2333
Copy link
Owner

Well2333 commented Jul 8, 2024

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

@DreamGallery
Copy link
Author

DreamGallery commented Jul 8, 2024

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

就像我之前说的,文字不是在开头出现的就没有read-article-holder,如果后面的文字使用其他xpath去匹配的那没问题了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working question Further information is requested
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants