apache · alamb · Aug 15, 2024 · Aug 9, 2024 · Aug 9, 2024 · Aug 9, 2024
diff --git a/.gitignore b/.gitignore
@@ -16,3 +16,5 @@ Cargo.lock
 .vscode
 
 *.swp
+
+.DS_store
diff --git a/src/parser/mod.rs b/src/parser/mod.rs
@@ -2136,7 +2136,7 @@ impl<'a> Parser<'a> {
     /// ```
     fn parse_bigquery_struct_literal(&mut self) -> Result<Expr, ParserError> {
         let (fields, trailing_bracket) =
-            self.parse_struct_type_def(Self::parse_struct_field_def)?;
+            self.parse_struct_type_def(Self::parse_struct_field_def, Token::Lt)?;
         if trailing_bracket.0 {
             return parser_err!("unmatched > in STRUCT literal", self.peek_token().location);
         }
@@ -2196,6 +2196,7 @@ impl<'a> Parser<'a> {
     fn parse_struct_type_def<F>(
         &mut self,
         mut elem_parser: F,
+        token: Token,
     ) -> Result<(Vec<StructField>, MatchedTrailingBracket), ParserError>
     where
         F: FnMut(&mut Parser<'a>) -> Result<(StructField, MatchedTrailingBracket), ParserError>,
@@ -2204,7 +2205,7 @@ impl<'a> Parser<'a> {
         self.expect_keyword(Keyword::STRUCT)?;
 
         // Nothing to do if we have no type information.
-        if Token::Lt != self.peek_token() {
+        if token != self.peek_token() {
             return Ok((Default::default(), false.into()));
         }
         self.next_token();
@@ -2227,7 +2228,15 @@ impl<'a> Parser<'a> {
 
         Ok((
             field_defs,
-            self.expect_closing_angle_bracket(trailing_bracket)?,
+            if token == Token::Lt {
+                self.expect_closing_angle_bracket(trailing_bracket)?
+            } else {
+                if !trailing_bracket.0 {
+                    self.expect_token(&Token::RParen)?;
+                };
+
+                false.into()
+            },
         ))
     }
 
@@ -7229,10 +7238,17 @@ impl<'a> Parser<'a> {
                         ))))
                     }
                 }
+                Keyword::STRUCT if dialect_of!(self is DuckDbDialect) => {
+                    self.prev_token();
+                    let (field_defs, _trailing_bracket) =
+                        self.parse_struct_type_def(Self::parse_struct_field_def, Token::LParen)?;
+
+                    Ok(DataType::Struct(field_defs))
+                }
                 Keyword::STRUCT if dialect_of!(self is BigQueryDialect | GenericDialect) => {
                     self.prev_token();
                     let (field_defs, _trailing_bracket) =
-                        self.parse_struct_type_def(Self::parse_struct_field_def)?;
+                        self.parse_struct_type_def(Self::parse_struct_field_def, Token::Lt)?;
                     trailing_bracket = _trailing_bracket;
                     Ok(DataType::Struct(field_defs))
                 }

diff --git a/tests/sqlparser_bigquery.rs b/tests/sqlparser_bigquery.rs
@@ -21,6 +21,16 @@ use sqlparser::dialect::{BigQueryDialect, GenericDialect};
 use sqlparser::parser::{ParserError, ParserOptions};
 use test_utils::*;
 
+#[test]
+fn test_struct() {
+    // nested struct
+    let canonical = r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, s STRUCT<a1 INTEGER, a2 VARCHAR>>[])"#;
+    let sql = r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, s STRUCT<a1 INTEGER, a2 VARCHAR>>[])"#;
+    let select = bigquery().parse_sql_statements(sql).unwrap().pop().unwrap();
+    // TODO: '>>' is incorrect parsed in bigquery syntax
+    assert_ne!(select.to_string(), canonical);
+}
+
 #[test]
 fn parse_literal_string() {
     let sql = concat!(

diff --git a/tests/sqlparser_duckdb.rs b/tests/sqlparser_duckdb.rs
@@ -32,6 +32,39 @@ fn duckdb_and_generic() -> TestedDialects {
     }
 }
 
+#[test]
+fn test_struct() {
+    // basic struct
+    let canonical = r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, i INTEGER>)"#;
+    let sql = r#"CREATE TABLE t1 (s STRUCT(v VARCHAR, i INTEGER))"#;
+    let select = duckdb().parse_sql_statements(sql).unwrap().pop().unwrap();
+    assert_eq!(select.to_string(), canonical);
+
+    // struct array
+    let canonical = r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, i INTEGER>[])"#;
+    let sql = r#"CREATE TABLE t1 (s STRUCT(v VARCHAR, i INTEGER)[])"#;
+    let select = duckdb().parse_sql_statements(sql).unwrap().pop().unwrap();
+    assert_eq!(select.to_string(), canonical);
+
+    // nested struct
+    let canonical = r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, s STRUCT<a1 INTEGER, a2 VARCHAR>>[])"#;
+    let sql = r#"CREATE TABLE t1 (s STRUCT(v VARCHAR, s STRUCT(a1 INTEGER, a2 VARCHAR))[])"#;
+    let select = duckdb().parse_sql_statements(sql).unwrap().pop().unwrap();
+    assert_eq!(select.to_string(), canonical);
+
+    // failing test
+    let sql_list = vec![
+        r#"CREATE TABLE t1 (s STRUCT(v VARCHAR, i INTEGER)))"#,
+        r#"CREATE TABLE t1 (s STRUCT(v VARCHAR, i INTEGER>)"#,
+        r#"CREATE TABLE t1 (s STRUCT<v VARCHAR, i INTEGER>)"#,
+        r#"CREATE TABLE t1 (s STRUCT v VARCHAR, i INTEGER )"#,
+    ];
+
+    for sql in sql_list {
+        duckdb().parse_sql_statements(sql).unwrap_err();
+    }
+}
+
 #[test]
 fn test_select_wildcard_with_exclude() {
     let select = duckdb().verified_only_select("SELECT * EXCLUDE (col_a) FROM data");