Merge #415

415: report both terms & tokens missing from parser/lexer from CTLexerBuilder r=ltratt a=ratmice Co-authored-by: matt rice <[email protected]>
softdevteam · Aug 30, 2023 · 23aa953 · 23aa953
2 parents cb8195e + ba460a6
commit 23aa953
Show file tree

Hide file tree

Showing 3 changed files with 166 additions and 133 deletions.
diff --git a/lrlex/src/lib/ctbuilder.rs b/lrlex/src/lib/ctbuilder.rs
@@ -367,14 +367,14 @@ where
             None => (None, None),
         };
 
+        let mut has_unallowed_missing = false;
         if !self.allow_missing_terms_in_lexer {
             if let Some(ref mfl) = missing_from_lexer {
                 eprintln!("Error: the following tokens are used in the grammar but are not defined in the lexer:");
                 for n in mfl {
                     eprintln!("    {}", n);
                 }
-                fs::remove_file(outp).ok();
-                panic!();
+                has_unallowed_missing = true;
             }
         }
         if !self.allow_missing_tokens_in_parser {
@@ -383,10 +383,13 @@ where
                 for n in mfp {
                     eprintln!("    {}", n);
                 }
-                fs::remove_file(outp).ok();
-                panic!();
+                has_unallowed_missing = true;
             }
         }
+        if has_unallowed_missing {
+            fs::remove_file(outp).ok();
+            panic!();
+        }
 
         let mod_name = match self.mod_name {
             Some(s) => s.to_owned(),

diff --git a/lrpar/cttests/build.rs b/lrpar/cttests/build.rs
@@ -2,145 +2,165 @@ use cfgrammar::yacc::{YaccKind, YaccOriginalActionKind};
 use glob::glob;
 use lrlex::{CTLexerBuilder, DefaultLexerTypes};
 use lrpar::CTParserBuilder;
-use std::{env, fs, path::PathBuf};
+use std::{
+    env, fs,
+    path::{Path, PathBuf},
+};
 use yaml_rust::YamlLoader;
 
+fn run_test_path<P: AsRef<Path>>(path: P) -> Result<(), Box<dyn std::error::Error>> {
+    let out_dir = env::var("OUT_DIR").unwrap();
+    let path = path.as_ref();
+    if path.is_file() {
+        println!("cargo:rerun-if-changed={}", path.display());
+        // Parse test file
+        let s = fs::read_to_string(&path).unwrap();
+        let docs = YamlLoader::load_from_str(&s).unwrap();
+        let grm = &docs[0]["grammar"].as_str().unwrap();
+        let lex = &docs[0]["lexer"].as_str().unwrap();
+        let yacckind = match docs[0]["yacckind"].as_str().unwrap() {
+            "Original(YaccOriginalActionKind::NoAction)" => {
+                YaccKind::Original(YaccOriginalActionKind::NoAction)
+            }
+            "Original(YaccOriginalActionKind::UserAction)" => {
+                YaccKind::Original(YaccOriginalActionKind::UserAction)
+            }
+            "Grmtools" => YaccKind::Grmtools,
+            "Original(YaccOriginalActionKind::GenericParseTree)" => {
+                YaccKind::Original(YaccOriginalActionKind::GenericParseTree)
+            }
+            s => panic!("YaccKind '{}' not supported", s),
+        };
+        let (negative_yacc_flags, positive_yacc_flags) = &docs[0]["yacc_flags"]
+            .as_vec()
+            .map(|flags_vec| {
+                flags_vec
+                    .iter()
+                    .partition(|flag| flag.as_str().unwrap().starts_with('!'))
+            })
+            .unwrap_or_else(|| (Vec::new(), Vec::new()));
+        let positive_yacc_flags = positive_yacc_flags
+            .iter()
+            .map(|flag| flag.as_str().unwrap())
+            .collect::<Vec<_>>();
+        let negative_yacc_flags = negative_yacc_flags
+            .iter()
+            .map(|flag| {
+                let flag = flag.as_str().unwrap();
+                flag.strip_prefix('!').unwrap()
+            })
+            .collect::<Vec<_>>();
+        let yacc_flags = (&positive_yacc_flags, &negative_yacc_flags);
+        let (negative_lex_flags, positive_lex_flags) = &docs[0]["lex_flags"]
+            .as_vec()
+            .map(|flags_vec| {
+                flags_vec
+                    .iter()
+                    .partition(|flag| flag.as_str().unwrap().starts_with('!'))
+            })
+            .unwrap_or_else(|| (Vec::new(), Vec::new()));
+        let negative_lex_flags = negative_lex_flags
+            .iter()
+            .map(|flag| {
+                let flag = flag.as_str().unwrap();
+                flag.strip_prefix('!').unwrap()
+            })
+            .collect::<Vec<_>>();
+        let positive_lex_flags = positive_lex_flags
+            .iter()
+            .map(|flag| flag.as_str().unwrap())
+            .collect::<Vec<_>>();
+        let lex_flags = (&positive_lex_flags, &negative_lex_flags);
+
+        // The code below, in essence, replicates lrlex and lrpar's internal / undocumented
+        // filename conventions. If those change, this code will also have to change.
+
+        // Create grammar files
+        let base = path.file_stem().unwrap().to_str().unwrap();
+        let mut pg = PathBuf::from(&out_dir);
+        pg.push(format!("{}.y.rs", base));
+        fs::write(&pg, grm).unwrap();
+        let mut pl = PathBuf::from(&out_dir);
+        pl.push(format!("{}.l.rs", base));
+        fs::write(&pl, lex).unwrap();
+
+        // Build parser and lexer
+        let mut outp = PathBuf::from(&out_dir);
+        outp.push(format!("{}.y.rs", base));
+        outp.set_extension("rs");
+        let mut cp_build = CTParserBuilder::<DefaultLexerTypes<u32>>::new()
+            .yacckind(yacckind)
+            .grammar_path(pg.to_str().unwrap())
+            .output_path(&outp);
+        if let Some(flag) = check_flag(yacc_flags, "error_on_conflicts") {
+            cp_build = cp_build.error_on_conflicts(flag)
+        }
+        if let Some(flag) = check_flag(yacc_flags, "warnings_are_errors") {
+            cp_build = cp_build.warnings_are_errors(flag)
+        }
+        if let Some(flag) = check_flag(yacc_flags, "show_warnings") {
+            cp_build = cp_build.show_warnings(flag)
+        };
+        let cp = cp_build.build()?;
+
+        let mut outl = PathBuf::from(&out_dir);
+        outl.push(format!("{}.l.rs", base));
+        outl.set_extension("rs");
+        let mut cl_build = CTLexerBuilder::new()
+            .rule_ids_map(cp.token_map())
+            .lexer_path(pl.to_str().unwrap())
+            .output_path(&outl);
+        if let Some(flag) = check_flag(lex_flags, "allow_missing_terms_in_lexer") {
+            cl_build = cl_build.allow_missing_terms_in_lexer(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "allow_missing_tokens_in_parser") {
+            cl_build = cl_build.allow_missing_tokens_in_parser(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "dot_matches_new_line") {
+            cl_build = cl_build.dot_matches_new_line(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "case_insensitive") {
+            cl_build = cl_build.case_insensitive(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "multi_line") {
+            cl_build = cl_build.multi_line(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "swap_greed") {
+            cl_build = cl_build.swap_greed(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "ignore_whitespace") {
+            cl_build = cl_build.ignore_whitespace(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "unicode") {
+            cl_build = cl_build.unicode(flag)
+        }
+        if let Some(flag) = check_flag(lex_flags, "octal") {
+            cl_build = cl_build.octal(flag)
+        }
+        cl_build.build()?;
+    }
+    Ok(())
+}
+
 // Compiles the `*.test` files within `src`. Test files are written in Yaml syntax and have 4
 // mandatory sections: name (describing what the test does), yacckind (defining the grammar type
 // used), grammar (the grammar rules), and lexer (the lexing rules). The tests are compiled into
 // two modules `<filename>_y` and `<filename>_l`, which we can then import into src/lib.rs and
 // write tests for.
 fn main() -> Result<(), Box<dyn std::error::Error>> {
-    let out_dir = env::var("OUT_DIR").unwrap();
     for entry in glob("src/*.test")? {
+        run_test_path(entry.unwrap())?;
+    }
+    for entry in glob("src/ctfails/*.test")? {
         let path = entry.unwrap();
-        if path.is_file() {
-            println!("cargo:rerun-if-changed={}", path.display());
-            // Parse test file
-            let s = fs::read_to_string(&path).unwrap();
-            let docs = YamlLoader::load_from_str(&s).unwrap();
-            let grm = &docs[0]["grammar"].as_str().unwrap();
-            let lex = &docs[0]["lexer"].as_str().unwrap();
-            let yacckind = match docs[0]["yacckind"].as_str().unwrap() {
-                "Original(YaccOriginalActionKind::NoAction)" => {
-                    YaccKind::Original(YaccOriginalActionKind::NoAction)
-                }
-                "Original(YaccOriginalActionKind::UserAction)" => {
-                    YaccKind::Original(YaccOriginalActionKind::UserAction)
-                }
-                "Grmtools" => YaccKind::Grmtools,
-                "Original(YaccOriginalActionKind::GenericParseTree)" => {
-                    YaccKind::Original(YaccOriginalActionKind::GenericParseTree)
-                }
-                s => panic!("YaccKind '{}' not supported", s),
-            };
-            let (negative_yacc_flags, positive_yacc_flags) = &docs[0]["yacc_flags"]
-                .as_vec()
-                .map(|flags_vec| {
-                    flags_vec
-                        .iter()
-                        .partition(|flag| flag.as_str().unwrap().starts_with('!'))
-                })
-                .unwrap_or_else(|| (Vec::new(), Vec::new()));
-            let positive_yacc_flags = positive_yacc_flags
-                .iter()
-                .map(|flag| flag.as_str().unwrap())
-                .collect::<Vec<_>>();
-            let negative_yacc_flags = negative_yacc_flags
-                .iter()
-                .map(|flag| {
-                    let flag = flag.as_str().unwrap();
-                    flag.strip_prefix('!').unwrap()
-                })
-                .collect::<Vec<_>>();
-            let yacc_flags = (&positive_yacc_flags, &negative_yacc_flags);
-            let (negative_lex_flags, positive_lex_flags) = &docs[0]["lex_flags"]
-                .as_vec()
-                .map(|flags_vec| {
-                    flags_vec
-                        .iter()
-                        .partition(|flag| flag.as_str().unwrap().starts_with('!'))
-                })
-                .unwrap_or_else(|| (Vec::new(), Vec::new()));
-            let negative_lex_flags = negative_lex_flags
-                .iter()
-                .map(|flag| {
-                    let flag = flag.as_str().unwrap();
-                    flag.strip_prefix('!').unwrap()
-                })
-                .collect::<Vec<_>>();
-            let positive_lex_flags = positive_lex_flags
-                .iter()
-                .map(|flag| flag.as_str().unwrap())
-                .collect::<Vec<_>>();
-            let lex_flags = (&positive_lex_flags, &negative_lex_flags);
-
-            // The code below, in essence, replicates lrlex and lrpar's internal / undocumented
-            // filename conventions. If those change, this code will also have to change.
-
-            // Create grammar files
-            let base = path.file_stem().unwrap().to_str().unwrap();
-            let mut pg = PathBuf::from(&out_dir);
-            pg.push(format!("{}.y.rs", base));
-            fs::write(&pg, grm).unwrap();
-            let mut pl = PathBuf::from(&out_dir);
-            pl.push(format!("{}.l.rs", base));
-            fs::write(&pl, lex).unwrap();
-
-            // Build parser and lexer
-            let mut outp = PathBuf::from(&out_dir);
-            outp.push(format!("{}.y.rs", base));
-            outp.set_extension("rs");
-            let mut cp_build = CTParserBuilder::<DefaultLexerTypes<u32>>::new()
-                .yacckind(yacckind)
-                .grammar_path(pg.to_str().unwrap())
-                .output_path(&outp);
-            if let Some(flag) = check_flag(yacc_flags, "error_on_conflicts") {
-                cp_build = cp_build.error_on_conflicts(flag)
-            }
-            if let Some(flag) = check_flag(yacc_flags, "warnings_are_errors") {
-                cp_build = cp_build.warnings_are_errors(flag)
-            }
-            if let Some(flag) = check_flag(yacc_flags, "show_warnings") {
-                cp_build = cp_build.show_warnings(flag)
-            };
-            let cp = cp_build.build()?;
-
-            let mut outl = PathBuf::from(&out_dir);
-            outl.push(format!("{}.l.rs", base));
-            outl.set_extension("rs");
-            let mut cl_build = CTLexerBuilder::new()
-                .rule_ids_map(cp.token_map())
-                .lexer_path(pl.to_str().unwrap())
-                .output_path(&outl);
-            if let Some(flag) = check_flag(lex_flags, "allow_missing_terms_in_lexer") {
-                cl_build = cl_build.allow_missing_terms_in_lexer(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "allow_missing_tokens_in_parser") {
-                cl_build = cl_build.allow_missing_tokens_in_parser(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "dot_matches_new_line") {
-                cl_build = cl_build.dot_matches_new_line(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "case_insensitive") {
-                cl_build = cl_build.case_insensitive(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "multi_line") {
-                cl_build = cl_build.multi_line(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "swap_greed") {
-                cl_build = cl_build.swap_greed(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "ignore_whitespace") {
-                cl_build = cl_build.ignore_whitespace(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "unicode") {
-                cl_build = cl_build.unicode(flag)
-            }
-            if let Some(flag) = check_flag(lex_flags, "octal") {
-                cl_build = cl_build.octal(flag)
-            }
-            cl_build.build()?;
+        let result =
+            std::panic::catch_unwind(|| std::panic::AssertUnwindSafe(run_test_path(&path).is_ok()));
+        if !result.is_err() {
+            panic!(
+                "ctfails/{}: succeded unexpectedly with result {:?}",
+                path.display(),
+                result
+            );
         }
     }
     Ok(())

diff --git a/lrpar/cttests/src/ctfails/missing.test b/lrpar/cttests/src/ctfails/missing.test
@@ -0,0 +1,10 @@
+name: Test missing terms in lexer and parser 
+yacckind: Original(YaccOriginalActionKind::NoAction)
+lex_flags: [ '!allow_missing_terms_in_lexer', '!allow_missing_tokens_in_parser' ]
+grammar: |
+    %%
+    S: 'B';
+
+lexer: |
+    %%
+    A "A"