-
Notifications
You must be signed in to change notification settings - Fork 72
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Add dynamic programming approach for schema search. #448
base: main
Are you sure you want to change the base?
Changes from 250 commits
889f2f7
8e6594f
d4f28ce
96e5df2
fee6fd4
ed23d9e
e6315ec
66cdf5c
23f7b61
0861ce3
a271e0c
7386f5a
f21b77f
fa4dd3f
0e4a6b4
d8ffc74
e3e6911
120342a
6de8355
47205ac
15ef079
bac9383
b65fde4
79809cc
d672056
21cfacc
0dd02a6
9473401
6876acb
e39ef1e
ee79d88
cc9a70c
96f18d5
19dbadb
fd94018
1196327
9718d56
1cf9bac
693ad94
979b029
a6f2025
2b8c883
6becc48
7366ed5
a44ecad
8f41624
46725f4
12f48b7
5b76807
8ad0793
50b79ba
0617c48
11fd9b7
ee16463
eb86d6a
c63cccb
61b3eb8
66275da
6702c9d
ff5b61f
93808f0
02b4a30
87880f8
1e69b99
e9fde16
f12aa15
7db1315
d698c01
67195ca
27b5e38
cb4242c
190cf41
5c033f4
843933d
9c60bd5
c68d6d9
003fe21
dae8f3d
d7c0c8a
777800d
2d95a7c
07622f2
b08eadd
a04ae6c
cce3368
a36a3f4
1df2298
d71f304
39787df
57f3d8f
465ab74
f69ea8a
08edc7c
e449751
b14184d
46ca422
7b60f33
667f4e3
c55a26a
b84a354
ce7f6ee
00f4982
53d6242
b3efd94
acd8819
86a5826
2159542
ff830cd
5f2de34
3e35c04
5447c27
90ee13e
4f06c18
d4e25ff
a8219d1
5213070
f138f99
2ce2ff7
fc184d1
19c3605
bbeca87
a0c2546
43b9a25
cf6b14b
30a88d4
384354b
864f355
16d9cdc
7b2ceba
092fce2
8a189fa
ee8a11f
f42d608
7b6d426
6e4c5a3
e8f24ec
ef28c42
23929a9
b033bd8
639de8e
ceb5d4d
db8e544
a360cd8
71c6b23
ebabea0
d016f17
e7ca083
3314838
7f30aa7
22fca92
b0f2c41
09731ec
16fee6e
5d41bf2
fda1fa0
67bf5ed
c35e2c1
7f75a2b
9eadd97
cee9e90
1851586
f059d01
f76765c
d8682d9
6a97f58
a0af1f0
1b19e26
daf3b0b
ebbff2d
aba48b3
fa6d602
b952ff6
c010c55
55ac74f
afabaef
a0e3265
151f362
4f09be3
497794f
d54c359
5a8d3a7
fd0cee9
5404421
369c2ac
a3470d7
73bb830
0fcc017
21f16d9
95c5529
10d3358
1bdd235
5ad17c4
c51509d
f3fa472
ca31075
e76a371
1a1f8c6
1334847
a44e50c
db2e14f
a508bfb
8192425
37fca8a
8680630
0a3ac80
28cf435
ce0684d
256669b
cb69a94
fb688c9
a9d7bcc
b561deb
90b27f2
845bf14
a5e1b0b
e1b8ad5
9b22f6f
b97d8ac
21fbcee
6f70f3a
4a6a041
79ef576
53cdc1e
a7962b2
4722167
e3ee26a
8f302dc
df42ca1
a2124d8
89af909
7ea6211
d077b14
a0f6a52
389f48b
7153c40
635e848
22d82a7
eb2ce26
8e852bc
eb52a94
5e07b89
1f93b9e
fabad21
9060179
28735b6
5e473f9
739e0d9
4c1b8db
f2ac3b5
7a139ee
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Large diffs are not rendered by default.
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
@@ -0,0 +1,195 @@ | ||||||||||||||||||||||
#include "QueryInterpretation.hpp" | ||||||||||||||||||||||
|
||||||||||||||||||||||
#include <algorithm> | ||||||||||||||||||||||
#include <cstdint> | ||||||||||||||||||||||
#include <ostream> | ||||||||||||||||||||||
#include <string> | ||||||||||||||||||||||
#include <utility> | ||||||||||||||||||||||
#include <variant> | ||||||||||||||||||||||
|
||||||||||||||||||||||
#include "Defs.h" | ||||||||||||||||||||||
#include "EncodedVariableInterpreter.hpp" | ||||||||||||||||||||||
#include "log_surgeon/Lexer.hpp" | ||||||||||||||||||||||
#include "LogTypeDictionaryEntry.hpp" | ||||||||||||||||||||||
#include "string_utils/string_utils.hpp" | ||||||||||||||||||||||
|
||||||||||||||||||||||
using log_surgeon::lexers::ByteLexer; | ||||||||||||||||||||||
using std::string; | ||||||||||||||||||||||
|
||||||||||||||||||||||
namespace clp { | ||||||||||||||||||||||
auto VariableQueryToken::operator<(VariableQueryToken const& rhs) const -> bool { | ||||||||||||||||||||||
if (m_variable_type < rhs.m_variable_type) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_variable_type > rhs.m_variable_type) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_query_substring < rhs.m_query_substring) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_query_substring > rhs.m_query_substring) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_has_wildcard != rhs.m_has_wildcard) { | ||||||||||||||||||||||
return rhs.m_has_wildcard; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_is_encoded != rhs.m_is_encoded) { | ||||||||||||||||||||||
return rhs.m_is_encoded; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
Comment on lines
+20
to
+40
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Logical error in 'operator<' implementation for 'VariableQueryToken' In the Similarly, when comparing Please revise the comparison logic to ensure it accurately represents the intended ordering of |
||||||||||||||||||||||
|
||||||||||||||||||||||
auto VariableQueryToken::operator>(VariableQueryToken const& rhs) const -> bool { | ||||||||||||||||||||||
if (m_variable_type > rhs.m_variable_type) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_variable_type < rhs.m_variable_type) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_query_substring > rhs.m_query_substring) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_query_substring < rhs.m_query_substring) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_has_wildcard != rhs.m_has_wildcard) { | ||||||||||||||||||||||
return m_has_wildcard; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_is_encoded != rhs.m_is_encoded) { | ||||||||||||||||||||||
return m_is_encoded; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
Comment on lines
+42
to
+62
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Logical error in 'operator>' implementation for 'VariableQueryToken' In the Please re-evaluate the logic in this operator to ensure it behaves as expected and provides a correct ordering between |
||||||||||||||||||||||
|
||||||||||||||||||||||
void QueryInterpretation::append_logtype(QueryInterpretation& suffix) { | ||||||||||||||||||||||
auto const& first_new_token = suffix.m_logtype[0]; | ||||||||||||||||||||||
if (auto& prev_token = m_logtype.back(); | ||||||||||||||||||||||
false == m_logtype.empty() && std::holds_alternative<StaticQueryToken>(prev_token) | ||||||||||||||||||||||
&& false == suffix.m_logtype.empty() | ||||||||||||||||||||||
&& std::holds_alternative<StaticQueryToken>(first_new_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
Comment on lines
+66
to
+70
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Potential undefined behaviour due to accessing 'm_logtype.back()' without checking for emptiness In the To prevent this, you should check if Apply this diff to fix the issue: void QueryInterpretation::append_logtype(QueryInterpretation& suffix) {
- if (auto& prev_token = m_logtype.back();
- false == m_logtype.empty() && std::holds_alternative<StaticQueryToken>(prev_token)
+ if (false == m_logtype.empty() && std::holds_alternative<StaticQueryToken>(m_logtype.back())
&& false == suffix.m_logtype.empty()
&& std::holds_alternative<StaticQueryToken>(suffix.m_logtype[0]))
{
+ auto& prev_token = m_logtype.back();
std::get<StaticQueryToken>(prev_token).append(std::get<StaticQueryToken>(first_new_token));
m_logtype.insert(m_logtype.end(), suffix.m_logtype.begin() + 1, suffix.m_logtype.end());
} else { 📝 Committable suggestion
Suggested change
|
||||||||||||||||||||||
std::get<StaticQueryToken>(prev_token).append(std::get<StaticQueryToken>(first_new_token)); | ||||||||||||||||||||||
m_logtype.insert(m_logtype.end(), suffix.m_logtype.begin() + 1, suffix.m_logtype.end()); | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
m_logtype.insert(m_logtype.end(), suffix.m_logtype.begin(), suffix.m_logtype.end()); | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
|
||||||||||||||||||||||
void QueryInterpretation::generate_logtype_string(ByteLexer& lexer) { | ||||||||||||||||||||||
// Convert each query logtype into a set of logtype strings. Logtype strings are used in the | ||||||||||||||||||||||
// sub query as they have the correct format for comparing against the archive. Also, a | ||||||||||||||||||||||
// single query logtype might represent multiple logtype strings. While static text converts | ||||||||||||||||||||||
// one-to-one, wildcard variables that may be encoded have different logtype strings when | ||||||||||||||||||||||
// comparing against the dictionary than they do when comparing against the segment. | ||||||||||||||||||||||
|
||||||||||||||||||||||
// Reserve size for m_logtype_string | ||||||||||||||||||||||
uint32_t logtype_string_size = 0; | ||||||||||||||||||||||
for (uint32_t i = 0; i < get_logtype_size(); i++) { | ||||||||||||||||||||||
if (auto const& logtype_token = get_logtype_token(i); | ||||||||||||||||||||||
std::holds_alternative<StaticQueryToken>(logtype_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
logtype_string_size | ||||||||||||||||||||||
+= std::get<StaticQueryToken>(logtype_token).get_query_substring().size(); | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
logtype_string_size++; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
m_logtype_string.reserve(logtype_string_size); | ||||||||||||||||||||||
|
||||||||||||||||||||||
for (uint32_t i = 0; i < get_logtype_size(); i++) { | ||||||||||||||||||||||
if (auto const& logtype_token = get_logtype_token(i); | ||||||||||||||||||||||
std::holds_alternative<StaticQueryToken>(logtype_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
m_logtype_string += std::get<StaticQueryToken>(logtype_token).get_query_substring(); | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
auto const& variable_token = std::get<VariableQueryToken>(logtype_token); | ||||||||||||||||||||||
auto const variable_type = variable_token.get_variable_type(); | ||||||||||||||||||||||
auto const& raw_string = variable_token.get_query_substring(); | ||||||||||||||||||||||
auto const is_encoded_with_wildcard = variable_token.get_is_encoded_with_wildcard(); | ||||||||||||||||||||||
auto const var_has_wildcard = variable_token.get_has_wildcard(); | ||||||||||||||||||||||
auto& schema_type = lexer.m_id_symbol[variable_type]; | ||||||||||||||||||||||
encoded_variable_t encoded_var = 0; | ||||||||||||||||||||||
if (is_encoded_with_wildcard) { | ||||||||||||||||||||||
if (cIntVarName == schema_type) { | ||||||||||||||||||||||
LogTypeDictionaryEntry::add_int_var(m_logtype_string); | ||||||||||||||||||||||
} else if (cFloatVarName == schema_type) { | ||||||||||||||||||||||
LogTypeDictionaryEntry::add_float_var(m_logtype_string); | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} else if (false == var_has_wildcard && cIntVarName == schema_type | ||||||||||||||||||||||
&& EncodedVariableInterpreter::convert_string_to_representable_integer_var( | ||||||||||||||||||||||
raw_string, | ||||||||||||||||||||||
encoded_var | ||||||||||||||||||||||
)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
LogTypeDictionaryEntry::add_int_var(m_logtype_string); | ||||||||||||||||||||||
} else if (false == var_has_wildcard && cFloatVarName == schema_type | ||||||||||||||||||||||
&& EncodedVariableInterpreter::convert_string_to_representable_float_var( | ||||||||||||||||||||||
raw_string, | ||||||||||||||||||||||
encoded_var | ||||||||||||||||||||||
)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
LogTypeDictionaryEntry::add_float_var(m_logtype_string); | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
LogTypeDictionaryEntry::add_dict_var(m_logtype_string); | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
|
||||||||||||||||||||||
auto QueryInterpretation::operator<(QueryInterpretation const& rhs) const -> bool { | ||||||||||||||||||||||
if (m_logtype.size() < rhs.m_logtype.size()) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_logtype.size() > rhs.m_logtype.size()) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
for (uint32_t i = 0; i < m_logtype.size(); i++) { | ||||||||||||||||||||||
if (m_logtype[i] < rhs.m_logtype[i]) { | ||||||||||||||||||||||
return true; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
if (m_logtype[i] > rhs.m_logtype[i]) { | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
return false; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
|
||||||||||||||||||||||
auto operator<<(std::ostream& os, QueryInterpretation const& query_logtype) -> std::ostream& { | ||||||||||||||||||||||
os << "logtype='"; | ||||||||||||||||||||||
for (uint32_t idx = 0; idx < query_logtype.get_logtype_size(); idx++) { | ||||||||||||||||||||||
if (auto const& query_token = query_logtype.get_logtype_token(idx); | ||||||||||||||||||||||
std::holds_alternative<StaticQueryToken>(query_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
os << std::get<StaticQueryToken>(query_token).get_query_substring(); | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
auto const& variable_token = std::get<VariableQueryToken>(query_token); | ||||||||||||||||||||||
os << "<" << variable_token.get_variable_type() << ">(" | ||||||||||||||||||||||
<< variable_token.get_query_substring() << ")"; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
os << "', has_wildcard='"; | ||||||||||||||||||||||
for (uint32_t idx = 0; idx < query_logtype.get_logtype_size(); idx++) { | ||||||||||||||||||||||
if (auto const& query_token = query_logtype.get_logtype_token(idx); | ||||||||||||||||||||||
std::holds_alternative<StaticQueryToken>(query_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
os << 0; | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
auto const& variable_token = std::get<VariableQueryToken>(query_token); | ||||||||||||||||||||||
os << variable_token.get_has_wildcard(); | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
os << "', is_encoded_with_wildcard='"; | ||||||||||||||||||||||
for (uint32_t idx = 0; idx < query_logtype.get_logtype_size(); idx++) { | ||||||||||||||||||||||
if (auto const& query_token = query_logtype.get_logtype_token(idx); | ||||||||||||||||||||||
std::holds_alternative<StaticQueryToken>(query_token)) | ||||||||||||||||||||||
{ | ||||||||||||||||||||||
os << 0; | ||||||||||||||||||||||
} else { | ||||||||||||||||||||||
auto const& variable_token = std::get<VariableQueryToken>(query_token); | ||||||||||||||||||||||
os << variable_token.get_is_encoded_with_wildcard(); | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} | ||||||||||||||||||||||
os << "', logtype_string='" << query_logtype.get_logtype_string() << "'"; | ||||||||||||||||||||||
return os; | ||||||||||||||||||||||
} | ||||||||||||||||||||||
} // namespace clp |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Correct the return type description in the documentation.
The function
generate_query_substring_interpretations
returns astd::set<QueryInterpretation>
, but the documentation states it returns a vector. Please update the documentation to accurately reflect the return type.