Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

bugfixes and improvements in automatic encoding detection #2111

Merged
merged 1 commit into from
Mar 30, 2024

Conversation

spnethw
Copy link
Contributor

@spnethw spnethw commented Mar 27, 2024

  1. Bug in DetectCodepage.cpp: TranslateUDCharset always returns -1 #2075
    задействует uchardet
  2. Suggestion: improve heuristic detection of UTF-32 encoding #2076
    позволяет корректно распознавать UTF-32 (взято решение от shmuz@3f453c4 )
  3. Suggestion: improve CheckForHardcodedByName function #2078
    апдейт актуальных строковых констант, возвращаемых uchardet

@spnethw spnethw changed the title bugfixes and improvings in automatic encoding detection bugfixes and improvements in automatic encoding detection Mar 27, 2024
@elfmz
Copy link
Owner

elfmz commented Mar 30, 2024

А в чем смысл использования std::map здесь? по скорости станет минимально быстрее, и весьма редкая операция, зато теперь надо каждому ноду мапы память выделить.. не уверен что эта оптимизация реально оптимизирует чтото.

@elfmz elfmz merged commit 0ee8118 into elfmz:master Mar 30, 2024
2 checks passed
@spnethw
Copy link
Contributor Author

spnethw commented Mar 30, 2024

Ну, как минимум, более читабельно, вроде, получается. Портянка из повторяющихся strcasecmp / return ухудшает восприятие (и дальнейшую модификацию при апдейтах uchardet).

@spnethw spnethw deleted the improved-automatic-encoding-detection branch March 30, 2024 11:01
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants