From b1dbd3968e6e3155d283302121bf18e677833823 Mon Sep 17 00:00:00 2001
From: Kyle Speer <54034650+kspeer825@users.noreply.github.com>
Date: Fri, 5 Feb 2021 11:36:19 -0500
Subject: [PATCH] Move tests fix config (#48)

* run-test not run-a-test

* specify env in project dir

* use v4 image

* remove SCENARIOS usage

* rename *_test_*.py -> test_*.py for auto fields, discoveries, bookmmarks

* rename remaining tests

* add context user, fix db imports tests

* fix base imports in tests

* fix the test_run call so we only run each test once

* fix run sync method

* auto fields test passing

* update feature tests

Co-authored-by: Kyle Speer <kspeer@stitchdata.com>
---
 .circleci/config.yml                    |  30 +-
 tests/base.py                           | 260 +++++++
 tests/database.py                       | 844 +++++++++++++++++++++++
 tests/spec.py                           | 155 +++++
 tests/test_automatic_fields.py          | 223 ++++++
 tests/test_bookmarks.py                 | 299 ++++++++
 tests/test_discovery_data_types.py      | 370 ++++++++++
 tests/test_discovery_multiple_dbs.py    | 272 ++++++++
 tests/test_discovery_names.py           | 264 +++++++
 tests/test_discovery_pks.py             | 280 ++++++++
 tests/test_discovery_unsupported_pks.py |  59 ++
 tests/test_full_replication.py          | 259 +++++++
 tests/test_pagination.py                |  68 ++
 tests/test_saas_stream.py               | 186 +++++
 tests/test_start_date.py                | 123 ++++
 tests/test_sync_full.py                 | 722 +++++++++++++++++++
 tests/test_sync_full_datetime.py        | 312 +++++++++
 tests/test_sync_full_decimal.py         | 424 ++++++++++++
 tests/test_sync_full_float.py           | 226 ++++++
 tests/test_sync_full_integers.py        | 360 ++++++++++
 tests/test_sync_full_multiple_dbs.py    | 391 +++++++++++
 tests/test_sync_full_names.py           | 394 +++++++++++
 tests/test_sync_full_others.py          | 340 +++++++++
 tests/test_sync_full_pks.py             | 587 ++++++++++++++++
 tests/test_sync_full_strings.py         | 394 +++++++++++
 tests/test_sync_incremental_datetime.py | 537 +++++++++++++++
 tests/test_sync_incremental_decimal.py  | 518 ++++++++++++++
 tests/test_sync_incremental_float.py    | 353 ++++++++++
 tests/test_sync_incremental_integers.py | 399 +++++++++++
 tests/test_sync_incremental_others.py   | 572 ++++++++++++++++
 tests/test_sync_incremental_pks.py      | 805 ++++++++++++++++++++++
 tests/test_sync_logical_datetime.py     | 550 +++++++++++++++
 tests/test_sync_logical_decimal.py      | 555 +++++++++++++++
 tests/test_sync_logical_float.py        | 414 +++++++++++
 tests/test_sync_logical_integers.py     | 450 ++++++++++++
 tests/test_sync_logical_multiple_dbs.py | 652 ++++++++++++++++++
 tests/test_sync_logical_names.py        | 607 ++++++++++++++++
 tests/test_sync_logical_others.py       | 568 +++++++++++++++
 tests/test_sync_logical_pks.py          | 875 ++++++++++++++++++++++++
 39 files changed, 15685 insertions(+), 12 deletions(-)
 create mode 100644 tests/base.py
 create mode 100644 tests/database.py
 create mode 100644 tests/spec.py
 create mode 100644 tests/test_automatic_fields.py
 create mode 100644 tests/test_bookmarks.py
 create mode 100644 tests/test_discovery_data_types.py
 create mode 100644 tests/test_discovery_multiple_dbs.py
 create mode 100644 tests/test_discovery_names.py
 create mode 100644 tests/test_discovery_pks.py
 create mode 100644 tests/test_discovery_unsupported_pks.py
 create mode 100644 tests/test_full_replication.py
 create mode 100644 tests/test_pagination.py
 create mode 100644 tests/test_saas_stream.py
 create mode 100644 tests/test_start_date.py
 create mode 100644 tests/test_sync_full.py
 create mode 100644 tests/test_sync_full_datetime.py
 create mode 100644 tests/test_sync_full_decimal.py
 create mode 100644 tests/test_sync_full_float.py
 create mode 100644 tests/test_sync_full_integers.py
 create mode 100644 tests/test_sync_full_multiple_dbs.py
 create mode 100644 tests/test_sync_full_names.py
 create mode 100644 tests/test_sync_full_others.py
 create mode 100644 tests/test_sync_full_pks.py
 create mode 100644 tests/test_sync_full_strings.py
 create mode 100644 tests/test_sync_incremental_datetime.py
 create mode 100644 tests/test_sync_incremental_decimal.py
 create mode 100644 tests/test_sync_incremental_float.py
 create mode 100644 tests/test_sync_incremental_integers.py
 create mode 100644 tests/test_sync_incremental_others.py
 create mode 100644 tests/test_sync_incremental_pks.py
 create mode 100644 tests/test_sync_logical_datetime.py
 create mode 100644 tests/test_sync_logical_decimal.py
 create mode 100644 tests/test_sync_logical_float.py
 create mode 100644 tests/test_sync_logical_integers.py
 create mode 100644 tests/test_sync_logical_multiple_dbs.py
 create mode 100644 tests/test_sync_logical_names.py
 create mode 100644 tests/test_sync_logical_others.py
 create mode 100644 tests/test_sync_logical_pks.py

diff --git a/.circleci/config.yml b/.circleci/config.yml
index c1bad05..e5a843e 100644
--- a/.circleci/config.yml
+++ b/.circleci/config.yml
@@ -31,7 +31,7 @@ jobs:
             - /root/.m2
   tap_tester:
     docker:
-      - image: 218546966473.dkr.ecr.us-east-1.amazonaws.com/circle-ci:tap-tester-clj
+      - image: 218546966473.dkr.ecr.us-east-1.amazonaws.com/circle-ci:tap-tester-clj-v4
       - image: mcr.microsoft.com/mssql/server:2017-latest
         environment:
           ACCEPT_EULA: Y
@@ -51,26 +51,28 @@ jobs:
       - run:
           name: 'Tap Tester'
           command: |
-            aws s3 cp s3://com-stitchdata-dev-deployment-assets/environments/tap-tester/sandbox tap-tester.env
-            source tap-tester.env
+            cd /root/project
+            aws s3 cp s3://com-stitchdata-dev-deployment-assets/environments/tap-tester/sandbox dev_env.sh
+            source dev_env.sh
             aws s3 cp s3://com-stitchdata-dev-deployment-assets/environments/tap-mssql/sandbox tap-mssql.env
             source tap-mssql.env
-            source /usr/local/share/virtualenvs/tap-tester/bin/activate
-            cd /root/project/
             lein deps
-            run-a-test --tap=/root/project/bin/tap-mssql \
-                       --target=target-stitch \
-                       --orchestrator=stitch-orchestrator \
-                       --email=harrison+sandboxtest@stitchdata.com \
-                       --password=$SANDBOX_PASSWORD \
-                       --client-id=50 \
-                       tap_tester.suites.mssql
+            source /usr/local/share/virtualenvs/tap-tester/bin/activate
+            run-test --tap=/root/project/bin/tap-mssql \
+                     --target=target-stitch \
+                     --orchestrator=stitch-orchestrator \
+                     --email=harrison+sandboxtest@stitchdata.com \
+                     --password=$SANDBOX_PASSWORD \
+                     --client-id=50 \
+                     tests
+
 workflows:
   version: 2
   build_and_test:
     jobs:
       - build
       - tap_tester:
+          context: circleci-user
           requires:
             - build
   build_daily:
@@ -83,3 +85,7 @@ workflows:
                 - master
     jobs:
       - build
+      - tap_tester:
+          context: circleci-user
+          requires:
+            - build
diff --git a/tests/base.py b/tests/base.py
new file mode 100644
index 0000000..795ed03
--- /dev/null
+++ b/tests/base.py
@@ -0,0 +1,260 @@
+"""
+Setup expectations for test sub classes
+Run discovery for as a prerequisite for most tests
+"""
+import unittest
+import os
+from datetime import datetime as dt
+from datetime import timezone as tz
+
+from tap_tester import connections, menagerie, runner
+
+from spec import TapSpec
+
+
+class BaseTapTest(TapSpec, unittest.TestCase):
+    """
+    Setup expectations for test sub classes
+    Run discovery for as a prerequisite for most tests
+    """
+
+    @staticmethod
+    def name():
+        """The name of the test within the suite"""
+        return "tap_tester_{}".format(TapSpec.tap_name())
+
+    def environment_variables(self):
+        return ({p for p in self.CONFIGURATION_ENVIRONMENT['properties'].values()} |
+                {c for c in self.CONFIGURATION_ENVIRONMENT['credentials'].values()})
+
+    def expected_streams(self):
+        """A set of expected stream ids"""
+        return set(self.expected_metadata().keys())
+
+    def child_streams(self):
+        """
+        Return a set of streams that are child streams
+        based on having foreign key metadata
+        """
+        return {stream for stream, metadata in self.expected_metadata().items()
+                if metadata.get(self.FOREIGN_KEYS)}
+
+    def expected_primary_keys_by_stream_id(self):
+        """
+        return a dictionary with key of table name (stream_id)
+        and value as a set of primary key fields
+        """
+        return {table: properties.get(self.PRIMARY_KEYS, set())
+                for table, properties in self.expected_metadata().items()}
+
+    def expected_replication_keys(self):
+        """
+        return a dictionary with key of table name
+        and value as a set of replication key fields
+        """
+        return {table: properties.get(self.REPLICATION_KEYS, set())
+                for table, properties
+                in self.expected_metadata().items()}
+
+    def add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                              column_type, primary_key, values=None, view: bool = False):
+        column_metadata = cls.expected_column_metadata(cls, column_name, column_type, primary_key)
+
+        data = {
+            cls.DATABASE_NAME: database_name,
+            cls.SCHEMA: "public" if schema_name is None else schema_name,
+            cls.STREAM: table_name,
+            cls.VIEW: view,
+            cls.PRIMARY_KEYS: primary_key,
+            cls.ROWS: 0,
+            cls.SELECTED: None,
+            cls.FIELDS: column_metadata,
+            cls.VALUES: values
+        }
+
+        cls.EXPECTED_METADATA["{}_{}_{}".format(
+            data[cls.DATABASE_NAME],
+            data[cls.SCHEMA],
+            data[cls.STREAM])] = data
+
+    def expected_column_metadata(self, column_name, column_type, primary_key):
+        column_metadata = [{x[0]: {self.DATATYPE: x[1]}} for x in list(zip(column_name, column_type))]
+        # primary keys have inclusion of automatic
+        for field in column_metadata:
+            if set(field.keys()).intersection(primary_key):
+                field[list(field.keys())[0]][self.INCLUSION] = self.AUTOMATIC_FIELDS
+                field[list(field.keys())[0]][self.DEFAULT_SELECT] = True
+
+        # other fields are available if supported otherwise unavailable (unsupported)
+        for field in column_metadata:
+            if not set(field.keys()).intersection(primary_key):
+                if field[list(field.keys())[0]][self.DATATYPE] in self.SUPPORTED_DATATYPES:
+                    field[list(field.keys())[0]][self.INCLUSION] = self.AVAILABLE_FIELDS
+                    field[list(field.keys())[0]][self.DEFAULT_SELECT] = True
+                else:
+                    field[list(field.keys())[0]][self.INCLUSION] = self.UNAVAILABLE_FIELDS
+                    field[list(field.keys())[0]][self.DEFAULT_SELECT] = False
+
+        # float's and real's don't keep there precision and 24 or less floats are actually reals
+        for field in column_metadata:
+            datatype = field[list(field.keys())[0]][self.DATATYPE]
+            index = datatype.find("(")
+            if index > -1:
+                if datatype[:index] == "float":
+                    if int(datatype[index+1:-1]) <= 24:
+                        field[list(field.keys())[0]][self.DATATYPE] = "real"
+                    else:
+                        field[list(field.keys())[0]][self.DATATYPE] = "float"
+
+        # rowversion shows up as type timestamp, they are synonyms
+        for field in column_metadata:
+            datatype = field[list(field.keys())[0]][self.DATATYPE]
+            if datatype == "rowversion":
+                field[list(field.keys())[0]][self.DATATYPE] = "timestamp"
+
+        # TODO - BUG - Remove this if we determine sql-datatypes should include precision/scale
+        for field in column_metadata:
+            datatype = field[list(field.keys())[0]][self.DATATYPE]
+            index = datatype.find("(")
+            if index > -1:  # and "numeric" not in datatype and "decimal" not in datatype:
+                field[list(field.keys())[0]][self.DATATYPE] = datatype[:index]
+        return column_metadata
+
+    def expected_foreign_keys(self):
+        """
+        return a dictionary with key of table name
+        and value as a set of foreign key fields
+        """
+        return {table: properties.get(self.FOREIGN_KEYS, set())
+                for table, properties
+                in self.expected_metadata().items()}
+
+    def expected_replication_method(self):
+        """return a dictionary with key of table name nd value of replication method"""
+        return {table: properties.get(self.REPLICATION_METHOD, None)
+                for table, properties
+                in self.expected_metadata().items()}
+
+    def setUp(self):
+        """Verify that you have set the prerequisites to run the tap (creds, etc.)"""
+        missing_envs = [x for x in self.environment_variables() if os.getenv(x) is None]
+        if missing_envs:
+            raise Exception("Missing test-required environment variables: {}".format(missing_envs))
+
+    #########################
+    #   Helper Methods      #
+    #########################
+
+    def create_connection(self, original_properties: bool = True):
+        """Create a new connection with the test name"""
+
+        # Create the connection
+        conn_id = connections.ensure_connection(self, original_properties)
+
+        # Run a check job using orchestrator (discovery)
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # Assert that the check job succeeded
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+        return conn_id
+
+    def run_sync(self, conn_id):
+        """
+        Run a sync job and make sure it exited properly.
+        Return a dictionary with keys of streams synced
+        and values of records synced for each stream
+        """
+        # Run a sync job using orchestrator
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # Verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # Verify actual rows were synced
+        sync_record_count = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        return sync_record_count
+
+    @staticmethod
+    def local_to_utc(date: dt):
+        """Convert a datetime with timezone information to utc"""
+        utc = dt(date.year, date.month, date.day, date.hour, date.minute,
+                 date.second, date.microsecond, tz.utc)
+
+        if date.tzinfo and hasattr(date.tzinfo, "_offset"):
+            utc += date.tzinfo._offset
+
+        return utc
+
+    def max_bookmarks_by_stream(self, sync_records):
+        """
+        Return the maximum value for the replication key for each stream
+        which is the bookmark expected value.
+
+        Comparisons are based on the class of the bookmark value. Dates will be
+        string compared which works for ISO date-time strings
+        """
+        max_bookmarks = {}
+        for stream, batch in sync_records.items():
+
+            upsert_messages = [m for m in batch.get('messages') if m['action'] == 'upsert']
+            stream_bookmark_key = self.expected_replication_keys().get(stream, set())
+            assert len(stream_bookmark_key) == 1  # There shouldn't be a compound replication key
+            stream_bookmark_key = stream_bookmark_key.pop()
+
+            bk_values = [message["data"].get(stream_bookmark_key) for message in upsert_messages]
+            max_bookmarks[stream] = {stream_bookmark_key: None}
+            for bk_value in bk_values:
+                if bk_value is None:
+                    continue
+
+                if max_bookmarks[stream][stream_bookmark_key] is None:
+                    max_bookmarks[stream][stream_bookmark_key] = bk_value
+
+                if bk_value > max_bookmarks[stream][stream_bookmark_key]:
+                    max_bookmarks[stream][stream_bookmark_key] = bk_value
+        return max_bookmarks
+
+    def min_bookmarks_by_stream(self, sync_records):
+        """Return the minimum value for the replication key for each stream"""
+        min_bookmarks = {}
+        for stream, batch in sync_records.items():
+
+            upsert_messages = [m for m in batch.get('messages') if m['action'] == 'upsert']
+            stream_bookmark_key = self.expected_replication_keys().get(stream, set())
+            assert len(stream_bookmark_key) == 1  # There shouldn't be a compound replication key
+            (stream_bookmark_key, ) = stream_bookmark_key
+
+            bk_values = [message["data"].get(stream_bookmark_key) for message in upsert_messages]
+            min_bookmarks[stream] = {stream_bookmark_key: None}
+            for bk_value in bk_values:
+                if bk_value is None:
+                    continue
+
+                if min_bookmarks[stream][stream_bookmark_key] is None:
+                    min_bookmarks[stream][stream_bookmark_key] = bk_value
+
+                if bk_value < min_bookmarks[stream][stream_bookmark_key]:
+                    min_bookmarks[stream][stream_bookmark_key] = bk_value
+        return min_bookmarks
+
+    @staticmethod
+    def select_all_streams_and_fields(conn_id, catalogs, select_all_fields: bool = True,
+                                      additional_md=[], non_selected_properties=[]):
+        """Select all streams and all fields within streams"""
+        for catalog in catalogs:
+            schema = menagerie.get_annotated_schema(conn_id, catalog['stream_id'])
+
+            if not select_all_fields and not non_selected_properties:
+                # get a list of all properties so that none are selected
+                non_selected_properties = schema.get('annotated-schema', {}).get(
+                    'properties', {}).keys()
+
+            connections.select_catalog_and_fields_via_metadata(
+                conn_id, catalog, schema, additional_md, non_selected_properties)
+
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        self.start_date = self.get_properties().get("start_date")
diff --git a/tests/database.py b/tests/database.py
new file mode 100644
index 0000000..09be739
--- /dev/null
+++ b/tests/database.py
@@ -0,0 +1,844 @@
+import os
+import socket
+from pprint import pprint
+from random import randint, sample
+
+import pyodbc
+
+USERNAME = os.getenv("STITCH_TAP_MSSQL_TEST_DATABASE_USER")
+PASSWORD = os.getenv("STITCH_TAP_MSSQL_TEST_DATABASE_PASSWORD")
+HOST = "localhost"
+
+LOWER_ALPHAS, UPPER_ALPHAS, DIGITS, OTHERS = set(), set(), set(), set()
+for letter in range(97, 123):
+    LOWER_ALPHAS.add(chr(letter))
+
+for letter in range(65, 91):
+    UPPER_ALPHAS.add(chr(letter))
+
+for digit in range(48, 58):
+    DIGITS.add(chr(digit))
+
+for invalid in set().union(range(32, 48), range(58, 65), range(91, 97), range(123, 127)):
+    OTHERS.add(chr(invalid))
+
+ALPHA_NUMERIC = LOWER_ALPHAS.union(UPPER_ALPHAS).union(DIGITS)
+
+
+def mssql_cursor_context_manager(*args):
+    """Decorator to switch into the iFrame before the method and switch back out after"""
+
+    server = "{},1433".format(HOST)
+    database = "master"
+    connection_string = (
+        "DRIVER={{ODBC Driver 17 for SQL Server}}"
+        ";SERVER={};DATABASE={};UID={};PWD={}".format(
+            server, database, USERNAME, PASSWORD))
+
+    print(connection_string.replace(PASSWORD, "[REDACTED]"))
+    connection = pyodbc.connect(connection_string, autocommit=True)
+    # https://github.com/mkleehammer/pyodbc/wiki/Unicode#configuring-specific-databases
+    # connection.setdecoding(pyodbc.SQL_CHAR, encoding='utf-8')
+    # connection.setdecoding(pyodbc.SQL_WCHAR, encoding='utf-8')
+    # connection.setencoding(encoding='utf-8')
+    # connection.add_output_converter(-155, handle_datetimeoffset)
+
+    with connection.cursor() as cursor:
+        for q in args:
+            print(q)
+            if isinstance(q, tuple):
+                cursor.executemany(*q)
+            else:
+                cursor.execute(q)
+            try:
+                results = cursor.fetchall()
+            except pyodbc.ProgrammingError:
+                results = None
+
+    connection.close()
+
+    return results
+
+
+def drop_all_user_databases():
+    """
+    Drop all user databases. Please run the PRINT first and make sure you're not dropping anything you may regret. You may want to take backups of all databases first just in case.
+
+    DECLARE @sql NVARCHAR(MAX) = N'';
+
+    SELECT @sql += N'
+      DROP DATABASE ' + QUOTENAME(name)
+      + N';'
+    FROM sys.databases
+    WHERE name NOT IN (N'master',N'tempdb',N'model',N'msdb');
+
+    PRINT @sql;
+    -- EXEC master.sys.sp_executesql @sql;
+    :return:
+    """
+    query_list = [
+        # "DECLARE @sql NVARCHAR(MAX) = N'';"
+        "SELECT N'DROP DATABASE ' + QUOTENAME(name) + N';' "
+        "FROM sys.databases "
+        "WHERE name NOT IN (N'master',N'tempdb',N'model',N'msdb',N'rdsadmin');"
+        # "PRINT @sql;"
+        # "EXEC master.sys.sp_executesql @sql;"
+    ]
+
+    results = mssql_cursor_context_manager(*query_list)
+    query_list = [x[0] for x in results]
+    if query_list:
+        mssql_cursor_context_manager(*query_list)
+
+
+def drop_database(db_name):
+    return ["DROP DATABASE IF EXISTS {};".format(db_name)]
+
+
+def create_database(db_name, collation: str = None):
+    """
+    CREATE DATABASE database_name
+    [ CONTAINMENT = { NONE | PARTIAL } ]
+    [ ON
+          [ PRIMARY ] <filespec> [ ,...n ]
+          [ , <filegroup> [ ,...n ] ]
+          [ LOG ON <filespec> [ ,...n ] ]
+    ]
+    [ COLLATE collation_name ]
+    [ WITH <option> [,...n ] ]
+    [;]
+    """
+    # return_value = drop_database(db_name)
+    return_value = list()
+    return_value.append(
+        "CREATE DATABASE {}{};".format(
+            db_name,
+            "" if collation is None else " COLLATE {}".format(collation))
+    )
+
+    # add user to databaseprint(query)
+    return_value.extend(use_db(db_name))
+    if USERNAME.upper() != "SA":
+        return_value.extend(create_user(USERNAME))
+    return return_value
+
+
+def enable_database_tracking(db_name):
+    return [
+        "ALTER DATABASE {} SET CHANGE_TRACKING = ON (CHANGE_RETENTION = 2 DAYS, AUTO_CLEANUP = ON)"
+        .format(db_name)]
+
+
+def create_user(user_name):
+    """
+    -- Syntax Users based on logins in master    mssql_cursor_context_manager(query)
+    CREATE USER user_name
+        [
+            { FOR | FROM } LOGIN login_name
+        ]
+        [ WITH <limited_options_list> [ ,... ] ]
+    [ ; ]
+    """
+    queries = list()
+    # queries.append("CREATE USER [{0}] FOR LOGIN [{0}];".format(user_name))
+    queries.append("ALTER ROLE [db_owner] ADD MEMBER [{}]".format(user_name))
+    return queries
+
+
+def use_db(db_name):
+    """
+    USE { database_name }
+    [;]
+    """
+    return ["USE {};".format(db_name)]
+
+
+def drop_schema(db_name, schema_name):
+    """
+    DROP SCHEMA  [ IF EXISTS ] schema_name
+    """
+    return_result = list(use_db(db_name))
+    return_result.append("DROP SCHEMA IF EXISTS {};".format(schema_name))
+    return return_result
+
+
+def create_schema(db_name, schema_name, owner_name: str = None):
+    """-- Syntax for SQL Server and Azure SQL Database
+
+    CREATE SCHEMA schema_name_clause [ <schema_element> [ ...n ] ]
+
+    <schema_name_clause> ::=
+        {
+        schema_name
+        | AUTHORIZATION owner_name
+        | schema_name AUTHORIZATION owner_name
+        }
+
+    <schema_element> ::=
+        {
+            table_definition | view_definition | grant_statement |
+            revoke_statement | deny_statement
+        }
+    """
+    # return_result = list(drop_schema(db_name, schema_name))
+    return_result = list()
+    return_result.append(
+        "CREATE SCHEMA {}{};".format(
+            schema_name,
+            "" if owner_name is None else " AUTHORIZATION {}".format(owner_name))
+    )
+
+    return return_result
+
+
+def drop_table(database_name, schema_name, table_name):
+    """
+    DROP TABLE [ IF EXISTS ] [ database_name . [ schema_name ] . | schema_name . ]
+    table_name [ ,...n ]
+    [ ; ]
+    """
+    return [
+        "DROP TABLE IF EXISTS {}{}{}".format(
+            "" if schema_name in (None, "public") else "{}.".format(database_name),
+            "" if schema_name in (None, "public") else "{}.".format(schema_name),
+            table_name)
+    ]
+
+
+def create_table(database_name, schema_name, table_name, columns: list,
+                 primary_key=None, foreign_key=None, reference=None, tracking=False):
+    """
+    --Simple CREATE TABLE Syntax (common if not using options)
+    CREATE TABLE
+        [ database_name . [ schema_name ] . | schema_name . ] table_name
+        ( { <column_definition> } [ ,...n ] )
+    [ ; ]
+
+    --Disk-Based CREATE TABLE Syntax
+    CREATE TABLE
+        [ database_name . [ schema_name ] . | schema_name . ] table_name
+        [ AS FileTable ]
+        ( {   <column_definition>
+            | <computed_column_definition>
+            | <column_set_definition>
+            | [ <table_constraint> ] [ ,... n ]
+            | [ <table_index> ] }
+              [ ,...n ]
+              [ PERIOD FOR SYSTEM_TIME ( system_start_time_column_name
+                 , system_end_time_column_name ) ]
+          )
+        [ ON { partition_scheme_name ( partition_column_name )
+               | filegroup
+               | "default" } ]
+        [ TEXTIMAGE_ON { filegroup | "default" } ]
+        [ FILESTREAM_ON { partition_scheme_name
+               | filegroup
+               | "default" } ]
+        [ WITH ( <table_option> [ ,...n ] ) ]
+    [ ; ]
+
+    <column_definition> ::=
+    column_name <data_type>
+        [ FILESTREAM ]
+        [ COLLATE collation_name ]
+        [ SPARSE ]
+        [ MASKED WITH ( FUNCTION = ' mask_function ') ]
+        [ CONSTRAINT constraint_name [ DEFAULT constant_expression ] ]
+        [ IDENTITY [ ( seed,increment ) ]
+        [ NOT FOR REPLICATION ]
+        [ GENERATED ALWAYS AS ROW { START | END } [ HIDDEN ] ]
+        [ NULL | NOT NULL ]
+        [ ROWGUIDCOL ]
+        [ ENCRYPTED WITH
+            ( COLUMN_ENCRYPTION_KEY = key_name ,
+              ENCRYPTION_TYPE = { DETERMINISTIC | RANDOMIZED } ,
+              ALGORITHM = 'AEAD_AES_256_CBC_HMAC_SHA_256'
+            ) ]
+        [ <column_constraint> [, ...n ] ]
+        [ <column_index> ]
+
+    <data type> ::=
+    [ type_schema_name . ] type_name
+        [ ( precision [ , scale ] | max |
+            [ { CONTENT | DOCUMENT } ] xml_schema_collection ) ]
+
+    <column_constraint> ::=
+    [ CONSTRAINT constraint_name ]
+    {     { PRIMARY KEY | UNIQUE }
+            [ CLUSTERED | NONCLUSTERED ]
+            [
+                WITH FILLFACTOR = fillfactor
+              | WITH ( < index_option > [ , ...n ] )
+            ]
+            [ ON { partition_scheme_name ( partition_column_name )
+                | filegroup | "default" } ]
+
+      | [ FOREIGN KEY ]
+            REFERENCES [ schema_name . ] referenced_table_name [ ( ref_column ) ]
+            [ ON DELETE { NO ACTION | CASCADE | SET NULL | SET DEFAULT } ]
+            [ ON UPDATE { NO ACTION | CASCADE | SET NULL | SET DEFAULT } ]
+            [ NOT FOR REPLICATION ]
+
+      | CHECK [ NOT FOR REPLICATION ] ( logical_expression )
+    }
+
+    <column_index> ::=
+     INDEX index_name [ CLUSTERED | NONCLUSTERED ]
+        [ WITH ( <index_option> [ ,... n ] ) ]
+        [ ON { partition_scheme_name (column_name )
+             | filegroup_name
+             | default
+             }
+        ]
+        [ FILESTREAM_ON { filestream_filegroup_name | partition_scheme_name | "NULL" } ]
+
+    <computed_column_definition> ::=
+    column_name AS computed_column_expression
+    [ PERSISTED [ NOT NULL ] ]
+    [
+        [ CONSTRAINT constraint_name ]
+        { PRIMARY KEY | UNIQUE }
+            [ CLUSTERED | NONCLUSTERED ]
+            [
+                WITH FILLFACTOR = fillfactor
+              | WITH ( <index_option> [ , ...n ] )
+            ]
+            [ ON { partition_scheme_name ( partition_column_name )
+            | filegroup | "default" } ]
+
+        | [ FOREIGN KEY ]
+            REFERENCES referenced_table_name [ ( ref_column ) ]
+            [ ON DELETE { NO ACTION | CASCADE } ]
+            [ ON UPDATE { NO ACTION } ]
+            [ NOT FOR REPLICATION ]
+
+        | CHECK [ NOT FOR REPLICATION ] ( logical_expression )
+    ]
+column_definition
+    <column_set_definition> ::=
+    column_set_name XML COLUMN_SET FOR ALL_SPARSE_COLUMNS
+
+    < table_constraint > ::=
+    [ CONSTRAINT constraint_name ]
+    {
+        { PRIMARY KEY | UNIQUE }
+            [ CLUSTERED | NONCLUSTERED ]
+            (column [ ASC | DESC ] [ ,...n ] )
+            [
+                WITH FILLFACTOR = fillfactor
+               |WITH ( <index_option> [ , ...n ] )
+            ]
+            [ ON { partition_scheme_name (partition_column_name)
+                | filegroup | "default" } ]
+        | FOREIGN KEY
+            ( column [ ,...n ] )
+            REFERENCES referenced_table_name [ ( ref_column [ ,...n ] ) ]
+            [ ON DELETE { NO ACTION | CASCADE | SET NULL | SET DEFAULT } ]
+            [ ON UPDATE { NO ACTION | CASCADE | SET NULL | SET DEFAULT } ]
+            [ NOT FOR REPLICATION ]
+        | CHECK [ NOT FOR REPLICATION ] ( logical_expression )
+
+    < table_index > ::=
+    {
+        {
+          INDEX index_name [ CLUSTERED | NONCLUSTERED ]
+             (column_name [ ASC | DESC ] [ ,... n ] )
+        | INDEX index_name CLUSTERED COLUMNSTORE
+        | INDEX index_name [ NONCLUSTERED ] COLUMNSTORE (column_name [ ,... n ] )
+        }
+        [ WITH ( <index_option> [ ,... n ] ) ]
+        [ ON { partition_scheme_name (column_name )
+             | filegroup_name
+             | default
+             }
+        ]
+        [ FILESTREAM_ON { filestream_filegroup_name | partition_scheme_name | "NULL" } ]
+
+    }
+
+    <table_option> ::=
+    {
+        [DATA_COMPRESSION = { NONE | ROW | PAGE }
+          [ ON PARTITIONS ( { <partition_number_expression> | <range> }
+          [ , ...n ] ) ]]
+        [ FILETABLE_DIRECTORY = <directory_name> ]
+        [ FILETABLE_COLLATE_FILENAME = { <collation_name> | database_default } ]
+        [ FILETABLE_PRIMARY_KEY_CONSTRAINT_NAME = <constraint_name> ]
+        [ FILETABLE_STREAMID_UNIQUE_CONSTRAINT_NAME = <constraint_name> ]
+        [ FILETABLE_FULLPATH_UNIQUE_CONSTRAINT_NAME = <constraint_name> ]
+        [ SYSTEM_VERSIONING = ON [ ( HISTORY_TABLE = schema_name . history_table_name
+            [, DATA_CONSISTENCY_CHECK = { ON | OFF } ] ) ] ]
+        [ REMOTE_DATA_ARCHIVE =
+          {
+              ON [ ( <table_stretch_options> [,...n] ) ]
+            | OFF ( MIGRATION_STATE = PAUSED )
+          }
+        ]
+    }
+
+    <table_stretch_options> ::=
+    {
+        [ FILTER_PREDICATE = { null | table_predicate_function } , ]
+          MIGRATION_STATE = { OUTBOUND | INBOUND | PAUSED }
+     }
+
+    <index_option> ::=
+    {
+        PAD_INDEX = { ON | OFF }
+      | FILLFACTOR = fillfactor
+      | IGNORE_DUP_KEY = { ON | OFF }
+      | STATISTICS_NORECOMPUTE = { ON | OFF }
+      | STATISTICS_INCREMENTAL = { ON | OFF }
+      | ALLOW_ROW_LOCKS = { ON | OFF}
+      | ALLOW_PAGE_LOCKS ={ ON | OFF}
+      | COMPRESSION_DELAY= {0 | delay [Minutes]}
+      | DATA_COMPRESSION = { NONE | ROW | PAGE | COLUMNSTORE | COLUMNSTORE_ARCHIVE }
+           [ ON PARTITIONS ( { <partition_number_expression> | <range> }
+           [ , ...n ] ) ]
+    }
+    <range> ::=
+    <partition_number_expression> TO <partition_number_expression>
+    """
+    # return_value = drop_table(database_name, schema_name, table_name)
+    return_value = list()
+    column_string = ",".join(columns)
+    return_value.append(
+        "CREATE TABLE {}{}{} ({}{}{});".format(
+            "" if schema_name in (None, "public") else "{}.".format(database_name),
+            "" if schema_name in (None, "public") else "{}.".format(schema_name),
+            table_name,
+            column_string,
+            "" if not primary_key else ", PRIMARY KEY ({})".format(
+                ",".join(primary_key)),
+            "" if foreign_key is None else ", FOREIGN KEY ({}) REFERENCES {}".format(
+                foreign_key, reference)
+            ),
+        )
+    if tracking:
+        return_value.extend(enable_tracking_table(database_name, schema_name, table_name))
+    return return_value
+
+
+def enable_tracking_table(database_name, schema_name, table_name):
+    return [
+        "ALTER TABLE {}{}{}  ENABLE CHANGE_TRACKING".format(  # WITH (TRACK_COLUMNS_UPDATED = ON)
+            "" if schema_name in (None, "public") else "{}.".format(database_name),
+            "" if schema_name in (None, "public") else "{}.".format(schema_name),
+            table_name)
+    ]
+
+
+def create_view(schema_name, view_name, select_statement):
+    """
+    CREATE [ OR ALTER ] VIEW [ schema_name . ] view_name [ (column [ ,...n ] ) ]
+    [ WITH <view_attribute> [ ,...n ] ]
+    AS select_statement
+    [ WITH CHECK OPTION ]
+    [ ; ]
+
+    <view_attribute> ::=
+    {
+        [ ENCRYPTION ]
+        [ SCHEMABINDING ]
+        [ VIEW_METADATA ]
+    }
+    """
+    return [
+        "CREATE VIEW {}{} AS {};".format(
+            "" if schema_name in (None, "public") else "{}.".format(schema_name),
+            view_name,
+            select_statement
+            )
+    ]
+
+
+def insert(database_name, schema_name, table_name, values: list, column_names=None):
+    """Values is a list of tuples to insert"""
+
+    if not isinstance(values, list):
+        raise ValueError("values needs to be a list because this is hokey")
+    fields = "(" + ", ".join(['?' for _ in values[0]]) + ")"
+
+    return [(
+        "INSERT INTO {}{}{}{} VALUES {}".format(
+            "" if schema_name in (None, "public") else "{}.".format(database_name),
+            "" if schema_name in (None, "public") else "{}.".format(schema_name),
+            table_name,
+            "" if column_names is None else "({})".format(", ".join([c for c in column_names])),
+            fields),
+        values
+    )]
+
+
+def update_by_pk(database_name, schema_name, table_name, values: list, column_names: list):
+    """Values is a rectangular list of tuples to update, with pk as the first value in the list"""
+
+    if not isinstance(values, list):
+        raise ValueError("values needs to be a list because this is hokey")
+    fields = ", ".join(["{} = ?".format(column_names[index]) for index, _ in enumerate(values[0])])
+
+    return_value = list()
+    for row in values:
+        return_value.extend([(
+            "UPDATE {}{}{} SET {} WHERE {} = ?".format(
+                "" if schema_name in (None, "public") else "{}.".format(database_name),
+                "" if schema_name in (None, "public") else "{}.".format(schema_name),
+                table_name,
+                fields,
+                column_names[0]),
+            [row + (row[0], )]  # add pk as last value
+        )])
+    return return_value
+
+
+def delete_by_pk(database_name, schema_name, table_name, values: list, column_names: list):
+    """Values is list of tuples with the pk value to delete"""
+
+    if not isinstance(values, list):
+        raise ValueError("values needs to be a list because this is hokey")
+
+    return_value = list()
+    for row in values:
+        return_value.extend([(
+            "DELETE FROM {}{}{} WHERE {}".format(
+                "" if schema_name in (None, "public") else "{}.".format(database_name),
+                "" if schema_name in (None, "public") else "{}.".format(schema_name),
+                table_name,
+                " AND ".join(["{} = ?".format(column_name) for column_name in column_names])),
+            [row]  # only support single column pk for now
+        )])
+    return return_value
+
+def do_setup():
+    database_name = "test_database3"
+    schema_name = "private"
+
+    query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+    query_list.extend(create_schema(database_name, schema_name))
+
+    # TARGET TYPES
+    #
+    # ✓ means that we're covered. - means we're unsure what it maps to.
+    #
+    # BIGINT ✓
+    # BIT ✓
+    # CHAR ✓
+    # DATE ✓
+    # DECIMAL ✓
+    # DOUBLE -
+    # FLOAT ✓
+    # INTEGER ✓
+    # LONGVARCHAR -
+    # LONGNVARCHAR -
+    # NCHAR ✓
+    # NVARCHAR ✓
+    # NUMERIC ✓
+    # REAL ✓
+    # SMALLINT ✓
+    # TIME ✓
+    # TIMESTAMP -
+    # TINYINT ✓
+    # VARCHAR ✓
+
+    #####################
+    #   Numeric data    #
+    #####################
+
+    table_name = "integers"
+    column_def = [
+        # BIGINT
+        "MyBigIntColumn bigint",
+        # INTEGER
+        "MyIntColumn  int",
+        # SMALLINT
+        "MySmallIntColumn smallint",
+        # TINIINT
+        "MyTinyIntColumn tinyint"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "most_bool_columns_allowed"
+    # BIT
+    column_def = ["a{} bit".format(hex(x)) for x in range(1024)]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # NUMERIC
+    table_name = "numeric_precisions"
+    column_def = [
+        "numeric_{0}_{1} numeric({0},{1})".format(precision + 1, randint(0, precision + 1))
+        for precision in range(38)
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # DECIMAL
+    table_name = "decimal_precisions"
+    column_def = [
+        "decimal_{0}_{1} decimal({0},{1})".format(precision + 1, randint(0, precision + 1))
+        for precision in range(38)
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # FLOAT
+    table_name = "float_precisions"
+    column_def = [
+        "float_{0}_bits float({0})".format(bits + 1) for bits in range(53)
+    ]
+    # REAL
+    column_def.append("real_24_bits real")
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "money_money_money"
+    column_def = ["cash_money money", "change smallmoney"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   Date Time Date  #
+    #####################
+
+    table_name = "dates_and_times"
+    column_def = [
+        # DATE
+        "just_a_date date",
+        # DATETIME
+        "date_and_time datetime",
+        "bigger_range_and_precision_datetime datetime2",
+        #
+        "datetime_with_timezones datetimeoffset",
+        "datetime_no_seconds smalldatetime",
+        # TIME
+        "its_time time"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   string/binary   #
+    #####################
+
+    table_name = "binary_data"
+    column_def = [
+        "binary_1 binary(1)",
+        "binary_8000 binary(8000)"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "varbinary_data"
+    column_def = [
+        "varbinary_1 varbinary(1)",
+        "varbinary_8000 varbinary(8000)",
+        "varbinary_max varbinary(max)"
+    ]
+    column_def.extend(["varbinary_{0} varbinary({0})".format(x) for x in sample(range(1, 8000), 3)])
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # CHAR
+    table_name = "char_data"
+    column_def = [
+        "char_1 char(1)",
+        "char_8000 char(8000)"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # VARCHAR
+    table_name = "varchar_data"
+    column_def = [
+        "varchar_1 varchar(1)",
+        "varchar_8000 varchar(8000)",
+        "varchar_max varchar(max)"
+    ]
+    column_def.extend(["varchar_{0} varchar({0})".format(x) for x in sample(range(1, 8000), 3)])
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # NCHAR
+    table_name = "nchar_data"
+    column_def = [
+        "nchar_1 nchar(1)",
+        "nchar_4000 nchar(4000)"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    # NVARCHAR
+    table_name = "nvarchar_data"
+    column_def = [
+        "nvarchar_1 nvarchar(1)",
+        "nvarchar_4000 nvarchar(4000)",
+        "nvarchar_max nvarchar(max)"
+    ]
+    column_def.extend(["nvarchar_{0} nvarchar({0})".format(x) for x in sample(range(1, 4000), 3)])
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "text_and_image_depricated_soon"
+    column_def = [
+        "nvarchar_text ntext",
+        "varchar_text text",
+        "varbinary_data image"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   others          #
+    #####################
+
+    table_name = "weirdos"
+    column_def = [
+        "geospacial geometry",
+        "geospacial_map geography",
+        "markup xml",
+        "guid uniqueidentifier",
+        "version rowversion",
+        "tree hierarchyid",
+        "variant sql_variant",
+        "SpecialPurposeColumns XML COLUMN_SET FOR ALL_SPARSE_COLUMNS"
+        # "connection cursor"
+        # "result_set table"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "computed_columns"
+    column_def = [
+        "started_at datetimeoffset",
+        "ended_at datetimeoffset",
+        "durations_days AS DATEDIFF(day, started_at, ended_at)"
+    ]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   Table Names     #
+    #####################
+
+    # Regular Indentifiers
+    column_def = ["pk int PRIMARY KEY"]
+    object_names = [
+        "#temporary_table", "a" * 128, "#" + "a" * 115, "##global_temp_table", "_underscores",
+        "collation_collision", "COLLATION_COLLISION", "special_charact#r$_@middle", "hebrew_ישראל",
+        "russian_самолетов", "chinese_久有归天愿", "ŝtelistoj", "[1834871389834_start_with_numbers]",
+        "[~&*$!^*%^$#@&%#$_special_characters]",
+        '"invalid_characters_{}"'.format("".join(OTHERS).replace('"', "")),
+        '[invalid_characters_{}]'.format("".join(OTHERS).replace("[", "").replace("]", "")),
+        "[tab_{}]".format(chr(9)), "[line_feed_{}]".format(chr(10)),
+        "[vertical_tab_{}]".format(chr(11)), "[form_feed_{}]".format(chr(12)),
+        "[return_{}]".format(chr(13))
+    ]
+
+    reserved_word = [
+        "ADD", "EXTERNAL", "PROCEDURE", "ALL", "FETCH", "PUBLIC", "ALTER", "FILE", "RAISERROR", "AND",
+        "FILLFACTOR", "READ", "ANY", "FOR", "READTEXT", "AS", "FOREIGN", "RECONFIGURE", "ASC",
+        "FREETEXT", "REFERENCES", "AUTHORIZATION", "FREETEXTTABLE", "REPLICATION", "BACKUP", "FROM",
+        "RESTORE", "BEGIN", "FULL", "RESTRICT", "BETWEEN", "FUNCTION", "RETURN", "BREAK", "GOTO",
+        "REVERT", "BROWSE", "GRANT", "REVOKE", "BULK", "GROUP", "RIGHT", "BY", "HAVING", "ROLLBACK",
+        "CASCADE", "HOLDLOCK", "ROWCOUNT", "CASE", "IDENTITY", "ROWGUIDCOL", "CHECK", "IDENTITY_INSERT",
+        "RULE", "CHECKPOINT", "IDENTITYCOL", "SAVE", "CLOSE", "IF", "SCHEMA", "CLUSTERED", "IN",
+        "SECURITYAUDIT", "COALESCE", "INDEX", "SELECT", "COLLATE", "INNER", "SEMANTICKEYPHRASETABLE",
+        "COLUMN", "INSERT", "SEMANTICSIMILARITYDETAILSTABLE", "COMMIT", "INTERSECT",
+        "SEMANTICSIMILARITYTABLE", "COMPUTE", "INTO", "SESSION_USER", "CONSTRAINT", "IS", "SET",
+        "CONTAINS", "JOIN", "SETUSER", "CONTAINSTABLE", "KEY", "SHUTDOWN", "CONTINUE", "KILL", "SOME",
+        "CONVERT", "LEFT", "STATISTICS", "CREATE", "LIKE", "SYSTEM_USER", "CROSS", "LINENO", "TABLE",
+        "CURRENT", "LOAD", "TABLESAMPLE", "CURRENT_DATE", "MERGE", "TEXTSIZE", "CURRENT_TIME",
+        "NATIONAL", "THEN", "CURRENT_TIMESTAMP", "NOCHECK", "TO", "CURRENT_USER", "NONCLUSTERED", "TOP",
+        "CURSOR", "NOT", "TRAN", "DATABASE", "NULL", "TRANSACTION", "DBCC", "NULLIF", "TRIGGER",
+        "DEALLOCATE", "OF", "TRUNCATE", "DECLARE", "OFF", "TRY_CONVERT", "DEFAULT", "OFFSETS", "TSEQUAL",
+        "DELETE", "ON", "UNION", "DENY", "OPEN", "UNIQUE", "DESC", "OPENDATASOURCE", "UNPIVOT", "DISK",
+        "OPENQUERY", "UPDATE", "DISTINCT", "OPENROWSET", "UPDATETEXT", "DISTRIBUTED", "OPENXML", "USE",
+        "DOUBLE", "OPTION", "USER", "DROP", "OR", "VALUES", "DUMP", "ORDER", "VARYING", "ELSE", "OUTER",
+        "VIEW", "END", "OVER", "WAITFOR", "ERRLVL", "PERCENT", "WHEN", "ESCAPE", "PIVOT", "WHERE",
+        "EXCEPT", "PLAN", "WHILE", "EXEC", "PRECISION", "WITH", "EXECUTE", "PRIMARY", "WITHIN",
+        "EXISTS", "PRINT", "WRITETEXT", "EXIT", "PROC"
+    ]
+
+    reserved_word = ['[{}]'.format(word) for word in reserved_word]
+    object_names.extend(reserved_word)
+
+    for table_name in object_names:
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   Column Names    #
+    #####################
+
+    column_def = ["{} bit".format(col) for col in object_names]
+    table_name = "column_name_test"
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   Constraints     #
+    #####################
+
+    table_name = "no_constraints"
+    column_def = ["column_name int"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "single_column_pk"
+    column_def = ["pk int PRIMARY KEY", "data int"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "multiple_column_pk"
+    column_def = [
+        "first_name varchar(256)",
+        "last_name varchar(256)",
+        "info int"
+    ]
+    constraint = ["first_name", "last_name"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                   primary_key=constraint))
+
+    table_name = "pk_with_unique_not_null"
+    column_def = ["pk int PRIMARY KEY", "data int NOT NULL UNIQUE"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "pk_with_fk"
+    column_def = ["pk int PRIMARY KEY", "fk int"]
+    foreign_key = "fk"
+    reference = "{}.pk_with_unique_not_null(pk)".format(schema_name)
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                   foreign_key=foreign_key, reference=reference))
+
+    table_name = "table_with_index"
+    column_def = ["pk int", "data int NOT NULL INDEX myindex"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "default_column"
+    column_def = ["pk int PRIMARY KEY", "created_at datetimeoffset DEFAULT CURRENT_TIMESTAMP"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    table_name = "check_constraint"
+    column_def = ["pk int PRIMARY KEY",
+                  "birthday datetimeoffset CHECK (birthday <= CURRENT_TIMESTAMP)"]
+    query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+
+    #####################
+    #   Partitions      #
+    #####################
+
+    # # https://www.cathrinewilhelmsen.net/2015/04/12/table-partitioning-in-sql-server/
+    # database_name = "test_partition"
+    # schema_name = "partition_schema"
+    #
+    # query_list.extend(create_database(database_name))
+    # query_list.extend(create_schema(database_name, schema_name))
+    #
+    # query_list.append(
+    #     "CREATE PARTITION FUNCTION pfSales (DATE) "
+    #     "AS RANGE RIGHT FOR VALUES "
+    #     "('2013-01-01', '2014-01-01', '2015-01-01');"
+    # )
+    #
+    # query_list.append(
+    #     "CREATE PARTITION SCHEME psSales "
+    #     "AS PARTITION pfSales "
+    #     "ALL TO ([Primary]);"
+    # )
+
+    # the_ones_to_run = query_list[:8] + query_list[-2:]
+    pprint(query_list)
+    rows = mssql_cursor_context_manager(*query_list)
+
+    # create_schema("test_database", "test_schema")
+    # rows = mssql_cursor_context_manager("SELECT name FROM master.sys.databases")
+    # print(rows)v
+
+
+if __name__ == "__main__":
+    rows = mssql_cursor_context_manager(*[
+        "select * from data_types_database.dbo.char_data;"
+        ])
+    print(rows)
+    # do_setup()
diff --git a/tests/spec.py b/tests/spec.py
new file mode 100644
index 0000000..25580e7
--- /dev/null
+++ b/tests/spec.py
@@ -0,0 +1,155 @@
+import os
+import socket
+
+
+class TapSpec:
+    """ Base class to specify tap-specific configuration. """
+
+    ### TABLE PROPERTIES ###
+    DATABASE_NAME = "database-name"
+    SCHEMA = "schema-name"
+    STREAM = "stream_name"
+    VIEW = "is-view"
+    PRIMARY_KEYS = "table-key-properties"
+    ROWS = "row-count"
+    SELECTED = "selected"  # is this for after discovery from field selection?
+    FIELDS = "fields"
+    VALUES = "values"
+
+    ### FIELD PROPERTIES
+    DATATYPE = "sql-datatype"
+    INCLUSION = "inclusion"
+    DEFAULT_SELECT = "selected-by-default"
+
+    ### OTHERS
+    REPLICATION_KEYS = "valid-replication-keys"
+    FOREIGN_KEYS = "table-foreign-key-properties"
+    AUTOMATIC_FIELDS = "automatic"
+    AVAILABLE_FIELDS = "available"
+    UNAVAILABLE_FIELDS = "unsupported"
+    REPLICATION_METHOD = "forced-replication-method"
+    API_LIMIT = "max-row-limit"
+    INCREMENTAL = "INCREMENTAL"
+    FULL = "FULL_TABLE"
+
+    # TODO - This assumes all columns are nullable which isn't true
+    DATATYPE_SCHEMAS = {
+        "bigint": {"type": ["integer", "null"], "maximum": 2 ** (8 * 8 - 1) - 1, "minimum": -2 ** (8 * 8 - 1)},
+        "int":  {"type": ["integer", "null"], "maximum": 2 ** (8 * 4 - 1) - 1, "minimum": -2 ** (8 * 4 - 1)},
+        "smallint":  {"type": ["integer", "null"], "maximum": 2 ** (8 * 2 - 1) - 1, "minimum": -2 ** (8 * 2 - 1)},
+        "tinyint":  {"type": ["integer", "null"], "maximum": 255, "minimum": 0},
+        "bit":  {"type": ["boolean", "null"]},
+        "real":  {"type": ["number", "null"]},
+        "float":  {"type": ["number", "null"]},
+        "numeric": {'multipleOf': 10 ** 0,
+                    "type": ["number", "null"],
+                    'maximum': 10 ** 18, 'exclusiveMinimum': True,
+                    'minimum': -10 ** 18, 'exclusiveMaximum': True},
+        "decimal": {'multipleOf': 10 ** 0,
+                    "type": ["number", "null"],
+                    'maximum': 10 ** 18, 'exclusiveMinimum': True,
+                    'minimum': -10 ** 18, 'exclusiveMaximum': True},
+        "char": {"type": ["string", "null"], "maxLength": 2, "minLength": 2},  # TODO this is just for char(2)
+        "varchar": {"type": ["string", "null"], "maxLength": 8000, "minLength": 0},  # TODO this is just for varchar(800)
+        "nvarchar": {"type": ["string", "null"], "maxLength": 8000, "minLength": 0},  # TODO this is just for nvarchar(800)
+        "date": {"type": ["string", "null"], 'format': 'date-time'},
+        "datetime": {"type": ["string", "null"], 'format': 'date-time'},
+        "time": {"type": ["string", "null"]},
+    }
+
+    for precision in range(1, 39):
+        for scale in range(precision + 1):
+            DATATYPE_SCHEMAS["numeric({},{})".format(precision, scale)] = {
+                'multipleOf': 10 ** (0 - scale),
+                "type": ["number", "null"],
+                'maximum':  10 ** (precision - scale), 'exclusiveMinimum': True,
+                'minimum': -10 ** (precision - scale), 'exclusiveMaximum': True
+            }
+
+    for precision in range(1, 39):
+        for scale in range(precision + 1):
+            DATATYPE_SCHEMAS["decimal({},{})".format(precision, scale)] = {
+                'multipleOf': 10 ** (0 - scale),
+                "type": ["number", "null"],
+                'maximum':  10 ** (precision - scale), 'exclusiveMinimum': True,
+                'minimum': -10 ** (precision - scale), 'exclusiveMaximum': True
+            }
+
+    # TODO - BUG  https://stitchdata.atlassian.net/browse/SRCE-1008
+    SUPPORTED_DATATYPES = [
+        "bigint", "int", "smallint", "tinyint", "bit", "real", "float",
+        "date", "datetime", "time", "datetime2", "datetimeoffset", "smalldatetime",
+        "char", "varchar", "varchar(max)", "nchar", "nvarchar", "nvarchar(max)",
+        "binary", "varbinary", "varbinary(max)", "uniqueidentifier", "timestamp", "rowversion",
+        "numeric", "decimal", "money", "smallmoney"
+    ]
+    SUPPORTED_DATATYPES.extend([
+            "numeric({0},{1})".format(precision, scale)
+            for precision in range(1, 39)
+            for scale in range(precision + 1)
+        ])
+    SUPPORTED_DATATYPES.extend([
+            "decimal({0},{1})".format(precision, scale)
+            for precision in range(1, 39)
+            for scale in range(precision + 1)
+        ])
+    SUPPORTED_DATATYPES.extend(["float({0})".format(bits + 1) for bits in range(53)])
+    SUPPORTED_DATATYPES.extend(["char({0})".format(chars + 1) for chars in range(8000)])
+    SUPPORTED_DATATYPES.extend(["varchar({0})".format(chars + 1) for chars in range(8000)])
+    SUPPORTED_DATATYPES.extend(["nchar({0})".format(chars + 1) for chars in range(4000)])
+    SUPPORTED_DATATYPES.extend(["nvarchar({0})".format(chars + 1) for chars in range(4000)])
+    SUPPORTED_DATATYPES.extend(["binary({0})".format(chars + 1) for chars in range(8000)])
+    SUPPORTED_DATATYPES.extend(["varbinary({0})".format(chars + 1) for chars in range(8000)])
+
+    CONFIGURATION_ENVIRONMENT = {
+        "properties": {
+            "user": "STITCH_TAP_MSSQL_TEST_DATABASE_USER",
+            "port": "STITCH_TAP_MSSQL_TEST_DATABASE_PORT"
+        },
+        "credentials": {
+            "password": "STITCH_TAP_MSSQL_TEST_DATABASE_PASSWORD",
+        }
+    }
+    TEST_DB_HOST="localhost"
+
+    @staticmethod
+    def tap_name():
+        """The name of the tap"""
+        return "mssql"
+
+    @staticmethod
+    def get_type():
+        """the expected url route ending"""
+        return "platform.mssql"
+
+    def get_properties(self, original: bool = True):
+        """Configuration properties required for the tap."""
+        properties_env = self.CONFIGURATION_ENVIRONMENT['properties']
+        return_value = {k: os.getenv(v) for k, v in properties_env.items()}
+        return_value['host'] = 'localhost'
+        return_value['include_schemas_in_destination_stream_name'] = 'true'
+        return return_value
+
+    def get_credentials(self):
+        """Authentication information for the test account"""
+        credentials_env = self.CONFIGURATION_ENVIRONMENT['credentials']
+        return {k: os.getenv(v) for k, v in credentials_env.items()}
+
+    def expected_metadata(self):
+        """The expected streams and metadata about the streams"""
+
+        default = {
+                self.REPLICATION_KEYS: {"updated_at"},
+                self.PRIMARY_KEYS: {"id"},
+                self.AVAILABLE_FIELDS: {},  # added, need to add to template
+                self.UNAVAILABLE_FIELDS: {},  # added, need to add to template
+                self.REPLICATION_METHOD: self.FULL,
+                self.API_LIMIT: 250
+        }
+
+        meta = default.copy()
+        meta.update({self.FOREIGN_KEYS: {"owner_id", "owner_resource"}})
+
+        return {
+            "full": default
+        }
diff --git a/tests/test_automatic_fields.py b/tests/test_automatic_fields.py
new file mode 100644
index 0000000..969f204
--- /dev/null
+++ b/tests/test_automatic_fields.py
@@ -0,0 +1,223 @@
+"""
+Test that with no fields selected for a stream automatic fields are still replicated
+"""
+from json import dumps
+from random import randint, sample
+from decimal import Decimal
+
+from tap_tester import runner, menagerie
+
+from base import BaseTapTest
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+class MinimumSelectionTest(BaseTapTest):
+    """Test that with no fields selected for a stream automatic fields are still replicated"""
+
+    def name(self):
+        return "{}_no_fields_test".format(super().name())
+
+    # @classmethod
+    # def setUpClass(cls) -> None:
+    #     """Create the expected schema in the test database"""
+    #     import pdb; pdb.set_trace()
+    #     do_setup()
+    EXPECTED_METADATA = dict()
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775807, 2147483647, 32767),
+                    (3, None, None, None),
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyBigIntColumn': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'MyBigIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 255, True),
+                    (2, None, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyTinyIntColumn': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MyTinyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        table_name = "integers"
+        column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that for each stream you can get multiple pages of data
+        when no fields are selected and only the automatic fields are replicated.
+
+        PREREQUISITE
+        For EACH stream add enough data that you surpass the limit of a single
+        fetch of data.  For instance if you have a limit of 250 records ensure
+        that 251 (or more) records have been posted for that stream.
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Select all streams and no fields within streams
+        # IF THERE ARE NO AUTOMATIC FIELDS FOR A STREAM
+        # WE WILL NEED TO UPDATE THE BELOW TO SELECT ONE
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        self.select_all_streams_and_fields(
+            conn_id, found_catalogs, select_all_fields=False, additional_md=additional_md,
+            non_selected_properties=["MySmallIntColumn","MyBigIntColumn", "MyTinyIntColumn", "my_boolean", "MyIntColumn"])
+
+        # Run a sync job using orchestrator
+        menagerie.set_state(conn_id, {})
+        record_count_by_stream = self.run_sync(conn_id)
+
+        actual_fields_by_stream = runner.examine_target_output_for_fields()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+
+                # verify that you get more than a page of data TODO this isn't really testing this...
+                # SKIP THIS ASSERTION FOR STREAMS WHERE YOU CANNOT GET
+                # MORE THAN 1 PAGE OF DATA IN THE TEST ACCOUNT
+                self.assertGreater(
+                    record_count_by_stream.get(stream, -1),
+                    self.expected_metadata().get(stream, {}).get(self.API_LIMIT, 0),
+                    msg="The number of records is not over the stream max limit")
+
+                # verify that only the automatic fields are sent to the target
+                self.assertEqual(
+                    actual_fields_by_stream.get(stream, set()),
+                    self.expected_primary_keys_by_stream_id().get(stream, set()) |
+                    self.expected_replication_keys().get(stream, set()) |
+                    self.expected_foreign_keys().get(stream, set()),
+                    msg="The fields sent to the target are not the automatic fields"
+                )
diff --git a/tests/test_bookmarks.py b/tests/test_bookmarks.py
new file mode 100644
index 0000000..321fa2d
--- /dev/null
+++ b/tests/test_bookmarks.py
@@ -0,0 +1,299 @@
+"""
+Test tap sets a bookmark and respects it for the next sync of a stream
+"""
+from datetime import datetime as dt
+from dateutil.parser import parse
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+from base import BaseTapTest
+
+
+class BookmarkTest(BaseTapTest):
+    """Test tap sets a bookmark and respects it for the next sync of a stream"""
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_bookmark_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775805, 2147483647, 32767),
+                    (3, 42, None, None), # TODO This was None before, is that something that should even be handled?
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'replication_key_column': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 253, True),
+                    (2, 255, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'replication_key_column': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "integers"
+        column_name = ["pk", "replication_key_column", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "replication_key_column", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that for each stream you can do a sync which records bookmarks.
+        That the bookmark is the maximum value sent to the target for the replication key.
+        That a second sync respects the bookmark
+            All data of the second sync is >= the bookmark from the first sync
+            The number of records in the 2nd sync is less then the first (This assumes that
+                new data added to the stream is done at a rate slow enough that you haven't
+                doubled the amount of data from the start date to the first sync between
+                the first sync and second sync run in this test)
+
+        Verify that only data for incremental streams is sent to the target
+
+        PREREQUISITE
+        For EACH stream that is incrementally replicated there are multiple rows of data with
+            different values for the replication key
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Select all streams and no fields within streams
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        incremental_streams = {key for key, value in self.expected_replication_method().items()
+                               if value == self.INCREMENTAL}
+
+        # IF THERE ARE STREAMS THAT SHOULD NOT BE TESTED
+        # REPLACE THE EMPTY SET BELOW WITH THOSE STREAMS
+        untested_streams = self.child_streams().union(set())
+        our_catalogs = [catalog for catalog in found_catalogs if
+                        catalog.get('tap_stream_id') in incremental_streams.difference(
+                            untested_streams)]
+        self.select_all_streams_and_fields(conn_id, our_catalogs)
+
+        # Run a sync job using orchestrator
+        first_sync_record_count = self.run_sync(conn_id)
+
+        # verify that the sync only sent records to the target for selected streams (catalogs)
+        self.assertEqual(set(first_sync_record_count.keys()),
+                         incremental_streams.difference(untested_streams))
+
+        first_sync_state = menagerie.get_state(conn_id)
+
+        # Get data about actual rows synced
+        first_sync_records = runner.get_records_from_target_output()
+        first_max_bookmarks = self.max_bookmarks_by_stream(first_sync_records)
+        first_min_bookmarks = self.min_bookmarks_by_stream(first_sync_records)
+
+        # Run a second sync job using orchestrator
+        second_sync_record_count = self.run_sync(conn_id)
+
+        # Get data about rows synced
+        second_sync_records = runner.get_records_from_target_output()
+        second_min_bookmarks = self.min_bookmarks_by_stream(second_sync_records)
+
+        # THIS MAKES AN ASSUMPTION THAT CHILD STREAMS DO NOT HAVE BOOKMARKS.
+        # ADJUST IF NECESSARY
+        for stream in incremental_streams.difference(untested_streams):
+            with self.subTest(stream=stream):
+
+                # get bookmark values from state and target data
+                stream_bookmark_key = self.expected_replication_keys().get(stream, set())
+                assert len(
+                    stream_bookmark_key) == 1  # There shouldn't be a compound replication key
+                stream_bookmark_key = stream_bookmark_key.pop()
+
+                state_value = first_sync_state.get("bookmarks", {}).get(
+                    stream, {None: None}).get(stream_bookmark_key)
+                target_value = first_max_bookmarks.get(
+                    stream, {None: None}).get(stream_bookmark_key)
+                target_min_value = first_min_bookmarks.get(
+                    stream, {None: None}).get(stream_bookmark_key)
+
+                try:
+                    # attempt to parse the bookmark as a date
+                    if state_value:
+                        if isinstance(state_value, str):
+                            state_value = self.local_to_utc(parse(state_value))
+                        if isinstance(state_value, int):
+                            state_value = self.local_to_utc(dt.utcfromtimestamp(state_value))
+
+                    if target_value:
+                        if isinstance(target_value, str):
+                            target_value = self.local_to_utc(parse(target_value))
+                        if isinstance(target_value, int):
+                            target_value = self.local_to_utc(dt.utcfromtimestamp(target_value))
+
+                    if target_min_value:
+                        if isinstance(target_min_value, str):
+                            target_min_value = self.local_to_utc(parse(target_min_value))
+                        if isinstance(target_min_value, int):
+                            target_min_value = self.local_to_utc(
+                                dt.utcfromtimestamp(target_min_value))
+
+                except (OverflowError, ValueError, TypeError):
+                    print("bookmarks cannot be converted to dates, comparing values directly")
+
+                # verify that there is data with different bookmark values - setup necessary
+                self.assertGreaterEqual(target_value, target_min_value,
+                                        msg="Data isn't set up to be able to test bookmarks")
+
+                # verify state agrees with target data after 1st sync
+                self.assertEqual(state_value, target_value,
+                                 msg="The bookmark value isn't correct based on target data")
+
+                # verify that you get less data the 2nd time around
+                self.assertGreater(
+                    first_sync_record_count.get(stream, 0),
+                    second_sync_record_count.get(stream, 0),
+                    msg="second syc didn't have less records, bookmark usage not verified")
+
+                # verify all data from 2nd sync >= 1st bookmark
+                target_value = second_min_bookmarks.get(
+                    stream, {None: None}).get(stream_bookmark_key)
+                try:
+                    if target_value:
+                        if isinstance(target_value, str):
+                            target_value = self.local_to_utc(parse(target_value))
+                        if isinstance(target_value, int):
+                            target_value = self.local_to_utc(dt.utcfromtimestamp(target_value))
+
+                except (OverflowError, ValueError, TypeError):
+                    print("bookmarks cannot be converted to dates, comparing values directly")
+
+                # verify that the minimum bookmark sent to the target for the second sync
+                # is greater than or equal to the bookmark from the first sync
+                self.assertGreaterEqual(target_value, state_value) # TODO no data changes b/t syncs, this is a bit misleading
+
+                # TODO TEST GOAL | create and update data between syncs
diff --git a/tests/test_discovery_data_types.py b/tests/test_discovery_data_types.py
new file mode 100644
index 0000000..e03be5b
--- /dev/null
+++ b/tests/test_discovery_data_types.py
@@ -0,0 +1,370 @@
+"""
+Test tap discovery
+"""
+from json import dumps
+from random import randint, sample
+
+from tap_tester import menagerie
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager
+
+from base import BaseTapTest
+
+
+class DiscoveryTestDataTypes(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_discovery_test_data_types".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "integers"
+        column_name = ["MyBigIntColumn", "MyIntColumn", "MySmallIntColumn", "MyTinyIntColumn"]
+        column_type = ["bigint", "int", "smallint", "tinyint"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "most_bool_columns_allowed"
+        column_name = ["a{}".format(hex(x)) for x in range(1024)]
+        column_type = ["bit" for _ in range(1024)]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "numeric_precisions"
+        column_type = [
+            "numeric({0},{1})".format(precision + 1, randint(0, precision + 1))
+            for precision in range(38)
+        ]
+        column_name = [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "decimal_precisions"
+        column_type = [
+            "decimal({0},{1})".format(precision + 1, randint(0, precision + 1))
+            for precision in range(38)
+        ]
+        column_name = [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "float_precisions"
+        column_type = ["float({0})".format(bits + 1) for bits in range(53)]
+        column_name = [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        column_type.append("real")
+        column_name.append("real_24_bits")
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "dates_and_times"
+        column_name = ["just_a_date", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        column_type = ["date", "datetime", "datetime2", "datetimeoffset", "smalldatetime", "time"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "char_data"
+        column_name = ["char_1", "char_8000"]
+        column_type = ["char(1)", "char(8000)"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "varchar_data"
+        column_name = ["varchar_1", "varchar_8000", "varchar_max"]
+        column_type = ["varchar(1)", "varchar(8000)", "varchar(max)"]
+        random_types = [x for x in sample(range(1, 8000), 3)]
+        column_name.extend(["varchar_{0}".format(x) for x in random_types])
+        column_type.extend(["varchar({0})".format(x) for x in random_types])
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "nchar_data"
+        column_name = ["nchar_1", "nchar_4000"]
+        column_type = ["nchar(1)", "nchar(4000)"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "nvarchar_data"
+        column_name = ["nvarchar_1", "nvarchar_4000", "nvarchar_max"]
+        column_type = ["nvarchar(1)", "nvarchar(4000)", "nvarchar(max)"]
+        random_types = [x for x in sample(range(1, 4000), 3)]
+        column_name.extend(["nvarchar_{0}".format(x) for x in random_types])
+        column_type.extend(["nvarchar({0})".format(x) for x in random_types])
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "money_money_money"
+        column_name = ["cash_money", "change"]
+        column_type = ["money", "smallmoney"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "binary_data"
+        column_name = ["binary_1", "binary_8000"]
+        column_type = ["binary(1)", "binary(8000)"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "varbinary_data"
+        column_name = ["varbinary_1", "varbinary_8000", "varbinary_max"]
+        column_type = ["varbinary(1)", "varbinary(8000)", "varbinary(max)"]
+        random_types = [x for x in sample(range(1, 8000), 3)]
+        column_name.extend(["varbinary_{0}".format(x) for x in random_types])
+        column_type.extend(["varbinary({0})".format(x) for x in random_types])
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["nvarchar_text", "varchar_text", "varbinary_data",
+                       "rowversion_synonym_timestamp"]
+        column_type = ["ntext", "text", "image", "timestamp"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "weirdos"
+        column_name = [
+            "geospacial", "geospacial_map", "markup", "guid", "version", "tree",
+            "variant", "SpecialPurposeColumns"
+        ]
+        column_type = [
+            "geometry", "geography", "xml", "uniqueidentifier", "rowversion", "hierarchyid",
+            "sql_variant", "xml COLUMN_SET FOR ALL_SPARSE_COLUMNS"
+        ]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        column_type[7] = "xml"  # this is the underlying type
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "computed_columns"
+        column_name = ["started_at", "ended_at", "durations_days"]
+        column_type = ["datetimeoffset", "datetimeoffset", "AS DATEDIFF(day, started_at, ended_at)"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        column_type[2] = "int"  # this is the underlying type of a datediff
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that discover creates the appropriate catalog, schema, metadata, etc.
+
+        • Verify number of actual streams discovered match expected
+        • Verify the stream names discovered were what we expect
+        • Verify stream names follow naming convention
+          streams should only have lowercase alphas and underscores
+        • verify there is only 1 top level breadcrumb
+        • verify replication key(s)
+        • verify primary key(s)
+        • verify that if there is a replication key we are doing INCREMENTAL otherwise FULL
+        • verify the actual replication matches our expected replication method
+        • verify that primary, replication and foreign keys
+          are given the inclusion of automatic (metadata and annotated schema).
+        • verify that all other fields have inclusion of available (metadata and schema)
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Verify number of actual streams discovered match expected
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        self.assertGreater(len(found_catalogs), 0,
+                           msg="unable to locate schemas for connection {}".format(conn_id))
+        self.assertEqual(len(found_catalogs),
+                         len(self.expected_streams()),
+                         msg="Expected {} streams, actual was {} for connection {},"
+                             " actual {}".format(
+                             len(self.expected_streams()),
+                             len(found_catalogs),
+                             found_catalogs,
+                             conn_id))
+
+        # Verify the stream names discovered were what we expect
+        found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+        self.assertEqual(set(self.expected_streams()),
+                         set(found_catalog_names),
+                         msg="Expected streams don't match actual streams")
+
+        # Verify stream names follow naming convention
+        # streams should only have lowercase alphas and underscores
+        # TODO - not sure this makes sense for databases.  Howe would we handle case sensitive?
+        # self.assertTrue(all([re.fullmatch(r"[a-z_]+", name) for name in found_catalog_names]),
+        #                 msg="One or more streams don't follow standard naming")
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                catalog = next(iter(
+                    [catalog for catalog in found_catalogs if catalog["tap_stream_id"] == stream]))
+                assert catalog  # based on previous tests this should always be found
+
+                # verify the database and schema in the catalog
+                self.assertEqual(catalog["metadata"][self.DATABASE_NAME],
+                                 self.expected_metadata()[stream][self.DATABASE_NAME],
+                                 msg="database-name incorrect")
+
+                self.assertEqual(catalog["metadata"][self.SCHEMA],
+                                 self.expected_metadata()[stream][self.SCHEMA],
+                                 msg="schema-name incorrect")
+                self.assertEqual(catalog[self.STREAM],
+                                 self.expected_metadata()[stream][self.STREAM],
+                                 msg="stream_name incorrect")
+                # verify the primary keys
+                self.assertEqual(set(catalog["metadata"][self.PRIMARY_KEYS]),
+                                 set(self.expected_metadata()[stream][self.PRIMARY_KEYS]),
+                                 msg="primary keys incorrect")
+
+                # verify that nothing is selected since this is the first discovery
+                self.assertTrue(all([catalog[self.SELECTED] is None,
+                                     catalog["metadata"][self.SELECTED] is None]))
+
+                schema_and_metadata = menagerie.get_annotated_schema(conn_id, catalog['stream_id'])
+                metadata = schema_and_metadata["metadata"]
+                # schema = schema_and_metadata["annotated-schema"]  # This is no longer relevant
+
+                # verify the stream level properties are as expected
+                # verify there is only 1 top level breadcrumb
+                stream_properties = [item for item in metadata if item.get("breadcrumb") == []]
+                self.assertTrue(len(stream_properties) == 1,
+                                msg="There is more than one top level breadcrumb")
+
+                # verify stream database name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.DATABASE_NAME: []}).get(self.DATABASE_NAME, []),
+                    self.expected_metadata()[stream][self.DATABASE_NAME],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.DATABASE_NAME],
+                        stream_properties[0].get(
+                            "metadata", {self.DATABASE_NAME: None}).get(self.DATABASE_NAME, [])))
+
+                # verify stream schema name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.SCHEMA: []}).get(self.SCHEMA, []),
+                    self.expected_metadata()[stream][self.SCHEMA],
+                    msg="expected schema name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.SCHEMA],
+                        stream_properties[0].get(
+                            "metadata", {self.SCHEMA: None}).get(self.SCHEMA, [])))
+
+                # verify stream primary keys
+                self.assertEqual(
+                    set(stream_properties[0].get(
+                        "metadata", {self.PRIMARY_KEYS: []}).get(self.PRIMARY_KEYS, [])),
+                    set(self.expected_primary_keys_by_stream_id()[stream]),
+                    msg="expected primary key s{} but actual is {}".format(
+                        set(self.expected_primary_keys_by_stream_id()[stream]),
+                        set(stream_properties[0].get(
+                            "metadata", {self.PRIMARY_KEYS: None}).get(self.PRIMARY_KEYS, []))))
+
+                # verify stream view or table
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.VIEW: []}).get(self.VIEW, []),
+                    self.expected_metadata()[stream][self.VIEW],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.VIEW],
+                        stream_properties[0].get("metadata", {self.VIEW: None}).get(self.VIEW, [])))
+
+                # verify there is no forced replication method
+                self.assertTrue(stream_properties[0].get(
+                    "metadata", {self.REPLICATION_METHOD: []}).get(
+                    self.REPLICATION_METHOD) is None)
+
+                # TODO - Verify that the meta-data includes valid-replication-keys
+                #   (based on sql-datatypes specific to this source)
+                field_properties = [{item['breadcrumb'][1]: item['metadata']} for item in metadata
+                                    if item.get("breadcrumb")
+                                    and item.get("breadcrumb")[0] == 'properties']
+
+                for expected_field in self.expected_metadata()[stream][self.FIELDS]:
+                    with self.subTest(field=expected_field):
+                        actual_field = [field for field in field_properties
+                                        if field.keys() == expected_field.keys()].pop()
+                        self.assertEqual(
+                            dumps(actual_field, sort_keys=True),
+                            dumps(expected_field, sort_keys=True),
+                            msg="field metadata mismatches")
diff --git a/tests/test_discovery_multiple_dbs.py b/tests/test_discovery_multiple_dbs.py
new file mode 100644
index 0000000..59a3b00
--- /dev/null
+++ b/tests/test_discovery_multiple_dbs.py
@@ -0,0 +1,272 @@
+"""
+Test tap discovery
+"""
+from json import dumps
+
+from tap_tester import menagerie
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, create_schema
+
+from base import BaseTapTest
+
+
+class DiscoveryTestManyDbs(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_discovery_test_multiple_dbs".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "database_name"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "TABLE_NAME"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "TABLE_NAME"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        database_name = "DATABASE_NAME_NO_COLLISION"
+        query_list.extend(create_database(database_name, "Latin1_General_CS_AS"))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "TABLE_NAME"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "TABLE_NAME"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that discover creates the appropriate catalog, schema, metadata, etc.
+
+        • Verify number of actual streams discovered match expected
+        • Verify the stream names discovered were what we expect
+        • Verify stream names follow naming convention
+          streams should only have lowercase alphas and underscores
+        • verify there is only 1 top level breadcrumb
+        • verify replication key(s)
+        • verify primary key(s)
+        • verify that if there is a replication key we are doing INCREMENTAL otherwise FULL
+        • verify the actual replication matches our expected replication method
+        • verify that primary, replication and foreign keys
+          are given the inclusion of automatic (metadata and annotated schema).
+        • verify that all other fields have inclusion of available (metadata and schema)
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Verify number of actual streams discovered match expected
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        self.assertGreater(len(found_catalogs), 0,
+                           msg="unable to locate schemas for connection {}".format(conn_id))
+        self.assertEqual(len(found_catalogs),
+                         len(self.expected_streams()),
+                         msg="Expected {} streams, actual was {} for connection {},"
+                             " actual {}".format(
+                             len(self.expected_streams()),
+                             len(found_catalogs),
+                             found_catalogs,
+                             conn_id))
+
+        # Verify the stream names discovered were what we expect
+        found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+        self.assertEqual(set(self.expected_streams()),
+                         set(found_catalog_names),
+                         msg="Expected streams don't match actual streams")
+
+        # Verify stream names follow naming convention
+        # streams should only have lowercase alphas and underscores
+        # TODO - not sure this makes sense for databases.  Howe would we handle case sensitive?
+        # self.assertTrue(all([re.fullmatch(r"[a-z_]+", name) for name in found_catalog_names]),
+        #                 msg="One or more streams don't follow standard naming")
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                catalog = next(iter(
+                    [catalog for catalog in found_catalogs if catalog["tap_stream_id"] == stream]))
+                assert catalog  # based on previous tests this should always be found
+
+                # verify the database and schema in the catalog
+                self.assertEqual(catalog["metadata"][self.DATABASE_NAME],
+                                 self.expected_metadata()[stream][self.DATABASE_NAME],
+                                 msg="database-name incorrect")
+
+                self.assertEqual(catalog["metadata"][self.SCHEMA],
+                                 self.expected_metadata()[stream][self.SCHEMA],
+                                 msg="schema-name incorrect")
+                self.assertEqual(catalog[self.STREAM],
+                                 self.expected_metadata()[stream][self.STREAM],
+                                 msg="stream_name incorrect")
+                # verify the primary keys
+                self.assertEqual(set(catalog["metadata"][self.PRIMARY_KEYS]),
+                                 set(self.expected_metadata()[stream][self.PRIMARY_KEYS]),
+                                 msg="primary keys incorrect")
+
+                # verify that nothing is selected since this is the first discovery
+                self.assertTrue(all([catalog[self.SELECTED] is None,
+                                     catalog["metadata"][self.SELECTED] is None]))
+
+                schema_and_metadata = menagerie.get_annotated_schema(conn_id, catalog['stream_id'])
+                metadata = schema_and_metadata["metadata"]
+                # schema = schema_and_metadata["annotated-schema"]  # This is no longer relevant
+
+                # verify the stream level properties are as expected
+                # verify there is only 1 top level breadcrumb
+                stream_properties = [item for item in metadata if item.get("breadcrumb") == []]
+                self.assertTrue(len(stream_properties) == 1,
+                                msg="There is more than one top level breadcrumb")
+
+                # verify stream database name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.DATABASE_NAME: []}).get(self.DATABASE_NAME, []),
+                    self.expected_metadata()[stream][self.DATABASE_NAME],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.DATABASE_NAME],
+                        stream_properties[0].get(
+                            "metadata", {self.DATABASE_NAME: None}).get(self.DATABASE_NAME, [])))
+
+                # verify stream schema name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.SCHEMA: []}).get(self.SCHEMA, []),
+                    self.expected_metadata()[stream][self.SCHEMA],
+                    msg="expected schema name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.SCHEMA],
+                        stream_properties[0].get(
+                            "metadata", {self.SCHEMA: None}).get(self.SCHEMA, [])))
+
+                # verify stream primary keys
+                self.assertEqual(
+                    set(stream_properties[0].get(
+                        "metadata", {self.PRIMARY_KEYS: []}).get(self.PRIMARY_KEYS, [])),
+                    set(self.expected_primary_keys_by_stream_id()[stream]),
+                    msg="expected primary key s{} but actual is {}".format(
+                        set(self.expected_primary_keys_by_stream_id()[stream]),
+                        set(stream_properties[0].get(
+                            "metadata", {self.PRIMARY_KEYS: None}).get(self.PRIMARY_KEYS, []))))
+
+                # verify stream view or table
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.VIEW: []}).get(self.VIEW, []),
+                    self.expected_metadata()[stream][self.VIEW],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.VIEW],
+                        stream_properties[0].get("metadata", {self.VIEW: None}).get(self.VIEW, [])))
+
+                # verify there is no forced replication method
+                self.assertTrue(stream_properties[0].get(
+                    "metadata", {self.REPLICATION_METHOD: []}).get(
+                    self.REPLICATION_METHOD) is None)
+
+                field_properties = [{item['breadcrumb'][1]: item['metadata']} for item in metadata
+                                    if item.get("breadcrumb")
+                                    and item.get("breadcrumb")[0] == 'properties']
+
+                for expected_field in self.expected_metadata()[stream][self.FIELDS]:
+                    with self.subTest(field=expected_field):
+                        actual_field = [field for field in field_properties
+                                        if field.keys() == expected_field.keys()].pop()
+                        self.assertEqual(
+                            dumps(actual_field, sort_keys=True),
+                            dumps(expected_field, sort_keys=True),
+                            msg="field metadata mismatches")
diff --git a/tests/test_discovery_names.py b/tests/test_discovery_names.py
new file mode 100644
index 0000000..2fd1b03
--- /dev/null
+++ b/tests/test_discovery_names.py
@@ -0,0 +1,264 @@
+"""
+Test tap discovery
+"""
+from json import dumps
+
+from tap_tester import menagerie
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager
+
+from base import BaseTapTest
+
+
+LOWER_ALPHAS, UPPER_ALPHAS, DIGITS, OTHERS = [], [], [], []
+for letter in range(97, 123):
+    LOWER_ALPHAS.append(chr(letter))
+
+for letter in range(65, 91):
+    UPPER_ALPHAS.append(chr(letter))
+
+for digit in range(48, 58):
+    DIGITS.append(chr(digit))
+
+for invalid in set().union(range(32, 48), range(58, 65), range(91, 97), range(123, 127)):
+    OTHERS.append(chr(invalid))
+
+ALPHA_NUMERIC = list(set(LOWER_ALPHAS).union(set(UPPER_ALPHAS)).union(set(DIGITS)))
+
+
+class DiscoveryTestNames(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_discovery_test_names".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "naming_convention_database"
+        schema_name = "dbo"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        object_names = [
+            "#temporary_table", "a" * 128, "#" + "a" * 115, "##global_temp_table", "_underscores",
+            "collation_collision", "COLLATION_COLLISION", "special_charact#r$_@middle",
+            "hebrew_ישראל", "russian_самолетов", "chinese_久有归天愿", "ŝtelistoj",
+            "[1834871389834_start_with_numbers]",
+            "[~&*$!^*%^$#@&%#$_special_characters]",
+            '"invalid_characters_{}"'.format("".join(OTHERS).replace('"', "")),
+            '[invalid_characters_{}]'.format("".join(OTHERS).replace("[", "").replace("]", "")),
+            "[tab_{}]".format(chr(9)), "[line_feed_{}]".format(chr(10)),
+            "[vertical_tab_{}]".format(chr(11)), "[form_feed_{}]".format(chr(12)),
+            "[return_{}]".format(chr(13))
+        ]
+        reserved_word = [
+            "ADD", "EXTERNAL", "PROCEDURE", "ALL", "FETCH", "PUBLIC", "ALTER", "FILE", "RAISERROR", "AND",
+            "FILLFACTOR", "READ", "ANY", "FOR", "READTEXT", "AS", "FOREIGN", "RECONFIGURE", "ASC",
+            "FREETEXT", "REFERENCES", "AUTHORIZATION", "FREETEXTTABLE", "REPLICATION", "BACKUP", "FROM",
+            "RESTORE", "BEGIN", "FULL", "RESTRICT", "BETWEEN", "FUNCTION", "RETURN", "BREAK", "GOTO",
+            "REVERT", "BROWSE", "GRANT", "REVOKE", "BULK", "GROUP", "RIGHT", "BY", "HAVING", "ROLLBACK",
+            "CASCADE", "HOLDLOCK", "ROWCOUNT", "CASE", "IDENTITY", "ROWGUIDCOL", "CHECK", "IDENTITY_INSERT",
+            "RULE", "CHECKPOINT", "IDENTITYCOL", "SAVE", "CLOSE", "IF", "SCHEMA", "CLUSTERED", "IN",
+            "SECURITYAUDIT", "COALESCE", "INDEX", "SELECT", "COLLATE", "INNER", "SEMANTICKEYPHRASETABLE",
+            "COLUMN", "INSERT", "SEMANTICSIMILARITYDETAILSTABLE", "COMMIT", "INTERSECT",
+            "SEMANTICSIMILARITYTABLE", "COMPUTE", "INTO", "SESSION_USER", "CONSTRAINT", "IS", "SET",
+            "CONTAINS", "JOIN", "SETUSER", "CONTAINSTABLE", "KEY", "SHUTDOWN", "CONTINUE", "KILL", "SOME",
+            "CONVERT", "LEFT", "STATISTICS", "CREATE", "LIKE", "SYSTEM_USER", "CROSS", "LINENO", "TABLE",
+            "CURRENT", "LOAD", "TABLESAMPLE", "CURRENT_DATE", "MERGE", "TEXTSIZE", "CURRENT_TIME",
+            "NATIONAL", "THEN", "CURRENT_TIMESTAMP", "NOCHECK", "TO", "CURRENT_USER", "NONCLUSTERED", "TOP",
+            "CURSOR", "NOT", "TRAN", "DATABASE", "NULL", "TRANSACTION", "DBCC", "NULLIF", "TRIGGER",
+            "DEALLOCATE", "OF", "TRUNCATE", "DECLARE", "OFF", "TRY_CONVERT", "DEFAULT", "OFFSETS", "TSEQUAL",
+            "DELETE", "ON", "UNION", "DENY", "OPEN", "UNIQUE", "DESC", "OPENDATASOURCE", "UNPIVOT", "DISK",
+            "OPENQUERY", "UPDATE", "DISTINCT", "OPENROWSET", "UPDATETEXT", "DISTRIBUTED", "OPENXML", "USE",
+            "DOUBLE", "OPTION", "USER", "DROP", "OR", "VALUES", "DUMP", "ORDER", "VARYING", "ELSE", "OUTER",
+            "VIEW", "END", "OVER", "WAITFOR", "ERRLVL", "PERCENT", "WHEN", "ESCAPE", "PIVOT", "WHERE",
+            "EXCEPT", "PLAN", "WHILE", "EXEC", "PRECISION", "WITH", "EXECUTE", "PRIMARY", "WITHIN",
+            "EXISTS", "PRINT", "WRITETEXT", "EXIT", "PROC"
+        ]
+        reserved_word = ['[{}]'.format(word) for word in reserved_word]
+        object_names.extend(reserved_word)
+
+        column_name = ["column_name"]
+        column_type = ["int"]
+        column_def = ["column_name int"]
+        primary_key = set()
+        for table_name in object_names:
+            query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+            if table_name[0] == "[" and table_name[-1] == "]":
+                table_name = table_name[1:-1]  # strip off brackets needed for reserved words
+            if table_name[0] == '"' and table_name[-1] == '"':
+                table_name = table_name[1:-1]  # strip off quotes needed for special characters
+            if table_name[0] != "#":  # we are not discovering temporary tables
+                cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                          column_type, primary_key)
+
+        table_name = "column_name_test"
+        column_name = ["{}".format(col) for col in object_names]
+        column_type = ["bit" for _ in object_names]
+        column_def = ["{} bit".format(col) for col in object_names]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def))
+        # strip off brackets needed for reserved words
+        column_name = [c[1:-1] if c[0] == "[" and c[-1] == "]" else c for c in column_name]
+        column_name = [c[1:-1] if c[0] == '"' and c[-1] == '"' else c for c in column_name]
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that discover creates the appropriate catalog, schema, metadata, etc.
+
+        • Verify number of actual streams discovered match expected
+        • Verify the stream names discovered were what we expect
+        • Verify stream names follow naming convention
+          streams should only have lowercase alphas and underscores
+        • verify there is only 1 top level breadcrumb
+        • verify replication key(s)
+        • verify primary key(s)
+        • verify that if there is a replication key we are doing INCREMENTAL otherwise FULL
+        • verify the actual replication matches our expected replication method
+        • verify that primary, replication and foreign keys
+          are given the inclusion of automatic (metadata and annotated schema).
+        • verify that all other fields have inclusion of available (metadata and schema)
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Verify number of actual streams discovered match expected
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        self.assertGreater(len(found_catalogs), 0,
+                           msg="unable to locate schemas for connection {}".format(conn_id))
+        found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+        self.assertEqual(len(found_catalogs),
+                         len(self.expected_streams()),
+                         msg="Expected {} streams, actual was {} symetric difference {}".format(
+                             len(self.expected_streams()),
+                             len(found_catalogs),
+                             set(found_catalog_names).symmetric_difference(self.expected_streams()),
+                             )
+                         )
+
+        # Verify the stream names discovered were what we expect
+        self.assertEqual(set(self.expected_streams()),
+                         set(found_catalog_names),
+                         msg="Expected streams don't match actual streams")
+
+        # Verify stream names follow naming convention
+        # streams should only have lowercase alphas and underscores
+        # TODO - not sure this makes sense for databases.  Howe would we handle case sensitive?
+        # self.assertTrue(all([re.fullmatch(r"[a-z_]+", name) for name in found_catalog_names]),
+        #                 msg="One or more streams don't follow standard naming")
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                catalog = next(iter(
+                    [catalog for catalog in found_catalogs
+                     if catalog and catalog["tap_stream_id"] == stream]))
+
+                # based on previous tests this should always be found
+                assert catalog, "there is no catalog for {}".forrmat(stream)
+
+                # verify the database and schema in the catalog
+                self.assertEqual(catalog["metadata"][self.DATABASE_NAME],
+                                 self.expected_metadata()[stream][self.DATABASE_NAME],
+                                 msg="database-name incorrect")
+
+                self.assertEqual(catalog["metadata"][self.SCHEMA],
+                                 self.expected_metadata()[stream][self.SCHEMA],
+                                 msg="schema-name incorrect")
+                self.assertEqual(catalog[self.STREAM],
+                                 self.expected_metadata()[stream][self.STREAM],
+                                 msg="stream_name incorrect")
+                # verify the primary keys
+                self.assertEqual(set(catalog["metadata"][self.PRIMARY_KEYS]),
+                                 set(self.expected_metadata()[stream][self.PRIMARY_KEYS]),
+                                 msg="primary keys incorrect")
+
+                # verify that nothing is selected since this is the first discovery
+                self.assertTrue(all([catalog[self.SELECTED] is None,
+                                     catalog["metadata"][self.SELECTED] is None]))
+
+                schema_and_metadata = menagerie.get_annotated_schema(conn_id, catalog['stream_id'])
+                metadata = schema_and_metadata["metadata"]
+                # schema = schema_and_metadata["annotated-schema"]  # This is no longer relevant
+
+                # verify the stream level properties are as expected
+                # verify there is only 1 top level breadcrumb
+                stream_properties = [item for item in metadata if item.get("breadcrumb") == []]
+                self.assertTrue(len(stream_properties) == 1,
+                                msg="There is more than one top level breadcrumb")
+
+                # verify stream database name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.DATABASE_NAME: []}).get(self.DATABASE_NAME, []),
+                    self.expected_metadata()[stream][self.DATABASE_NAME],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.DATABASE_NAME],
+                        stream_properties[0].get(
+                            "metadata", {self.DATABASE_NAME: None}).get(self.DATABASE_NAME, [])))
+
+                # verify stream schema name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.SCHEMA: []}).get(self.SCHEMA, []),
+                    self.expected_metadata()[stream][self.SCHEMA],
+                    msg="expected schema name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.SCHEMA],
+                        stream_properties[0].get(
+                            "metadata", {self.SCHEMA: None}).get(self.SCHEMA, [])))
+
+                # verify stream primary keys
+                self.assertEqual(
+                    set(stream_properties[0].get(
+                        "metadata", {self.PRIMARY_KEYS: []}).get(self.PRIMARY_KEYS, [])),
+                    set(self.expected_primary_keys_by_stream_id()[stream]),
+                    msg="expected primary key s{} but actual is {}".format(
+                        set(self.expected_primary_keys_by_stream_id()[stream]),
+                        set(stream_properties[0].get(
+                            "metadata", {self.PRIMARY_KEYS: None}).get(self.PRIMARY_KEYS, []))))
+
+                # verify stream view or table
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.VIEW: []}).get(self.VIEW, []),
+                    self.expected_metadata()[stream][self.VIEW],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.VIEW],
+                        stream_properties[0].get("metadata", {self.VIEW: None}).get(self.VIEW, [])))
+
+                # verify there is no forced replication method
+                self.assertTrue(stream_properties[0].get(
+                    "metadata", {self.REPLICATION_METHOD: []}).get(
+                    self.REPLICATION_METHOD) is None)
+
+                field_properties = [{item['breadcrumb'][1]: item['metadata']} for item in metadata
+                                    if item.get("breadcrumb")
+                                    and item.get("breadcrumb")[0] == 'properties']
+
+                for expected_field in self.expected_metadata()[stream][self.FIELDS]:
+                    with self.subTest(field=expected_field):
+                        actual_field = [field for field in field_properties
+                                        if field.keys() == expected_field.keys()]
+                        actual_field = actual_field.pop() if actual_field else dict()
+                        msg = None
+                        if not actual_field:
+                            msg = [field.keys() for field in field_properties]
+                        self.assertEqual(
+                            actual_field,
+                            expected_field,
+                            msg="field metadata mismatches. {}".format(msg))
diff --git a/tests/test_discovery_pks.py b/tests/test_discovery_pks.py
new file mode 100644
index 0000000..264e029
--- /dev/null
+++ b/tests/test_discovery_pks.py
@@ -0,0 +1,280 @@
+"""
+Test tap discovery
+"""
+from json import dumps
+
+from tap_tester import menagerie
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, create_view
+
+from base import BaseTapTest
+
+
+class DiscoveryTestKeys(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_discovery_test_pks".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "constraints_database"
+        schema_name = "dbo"
+
+        query_list = list(create_database(database_name,  "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "no_constraints"
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()  # ["bigint"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "multiple_column_pk"
+        column_name = ["first_name", "last_name", "info"]
+        column_type = ["varchar(256)", "varchar(256)", "int"]
+        primary_key = ["first_name", "last_name"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "single_column_pk"
+        column_name = ["pk", "data"]
+        column_type = ["int", "int"]
+        primary_key = ["pk"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "pk_with_unique_not_null"
+        column_name = ["pk", "data"]
+        column_type = ["int", "int NOT NULL UNIQUE"]
+        primary_key = ["pk"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        column_type = ["int", "int"]
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "pk_with_fk"
+        column_name = ["pk", "fk"]
+        column_type = ["int", "int"]
+        primary_key = ["pk"]
+        foreign_key = "fk"
+        reference = "{}.pk_with_unique_not_null(pk)".format(schema_name)
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def,
+            primary_key=primary_key, foreign_key=foreign_key, reference=reference))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "view_with_join"
+        column_name = ["column1", "data", "column2"]
+        column_type = ["int", "int", "int"]
+        primary_key = []
+        select = ("SELECT p.pk as column1, data, f.pk as column2 "
+                  "FROM pk_with_unique_not_null p "
+                  "JOIN pk_with_fk f on p.pk = f.fk")
+        query_list.extend(create_view(schema_name, table_name, select))
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key, view=True)
+
+        table_name = "table_with_index"
+        column_name = ["not_pk", "data"]
+        column_type = ["int", "int NOT NULL INDEX myindex"]
+        primary_key = []
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        column_type = ["int", "int"]
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "default_column"
+        column_name = ["pk", "created_at"]
+        column_type = ["int", "datetimeoffset DEFAULT CURRENT_TIMESTAMP"]
+        primary_key = ["pk"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key))
+        column_type = ["int", "datetimeoffset"]
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        table_name = "check_constraint"
+        column_name = ["pk", "birthday"]
+        column_type = ["int", "datetimeoffset CHECK (birthday <= CURRENT_TIMESTAMP)"]
+        primary_key = ["pk"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key))
+        column_type = ["int", "datetimeoffset"]
+        cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+                                  column_type, primary_key)
+
+        # TODO add in identity to this test.
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that discover creates the appropriate catalog, schema, metadata, etc.
+
+        • Verify number of actual streams discovered match expected
+        • Verify the stream names discovered were what we expect
+        • Verify stream names follow naming convention
+          streams should only have lowercase alphas and underscores
+        • verify there is only 1 top level breadcrumb
+        • verify replication key(s)
+        • verify primary key(s)
+        • verify that if there is a replication key we are doing INCREMENTAL otherwise FULL
+        • verify the actual replication matches our expected replication method
+        • verify that primary, replication and foreign keys
+          are given the inclusion of automatic (metadata and annotated schema).
+        • verify that all other fields have inclusion of available (metadata and schema)
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Verify number of actual streams discovered match expected
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        self.assertGreater(len(found_catalogs), 0,
+                           msg="unable to locate schemas for connection {}".format(conn_id))
+        self.assertEqual(len(found_catalogs),
+                         len(self.expected_streams()),
+                         msg="Expected {} streams, actual was {} for connection {},"
+                             " actual {}".format(
+                                 len(self.expected_streams()),
+                                 len(found_catalogs),
+                                 found_catalogs,
+                                 conn_id))
+
+        # Verify the stream names discovered were what we expect
+        found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+        self.assertEqual(set(self.expected_streams()),
+                         set(found_catalog_names),
+                         msg="Expected streams don't match actual streams")
+
+        # Verify stream names follow naming convention
+        # streams should only have lowercase alphas and underscores
+        # TODO - not sure this makes sense for databases.  Howe would we handle case sensitive?
+        # self.assertTrue(all([re.fullmatch(r"[a-z_]+", name) for name in found_catalog_names]),
+        #                 msg="One or more streams don't follow standard naming")
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                catalog = next(iter(
+                    [catalog for catalog in found_catalogs if catalog["tap_stream_id"] == stream]))
+                assert catalog  # based on previous tests this should always be found
+
+                # verify the database and schema in the catalog
+                self.assertEqual(catalog["metadata"][self.DATABASE_NAME],
+                                 self.expected_metadata()[stream][self.DATABASE_NAME],
+                                 msg="database-name incorrect")
+
+                self.assertEqual(catalog["metadata"][self.SCHEMA],
+                                 self.expected_metadata()[stream][self.SCHEMA],
+                                 msg="schema-name incorrect")
+                self.assertEqual(catalog[self.STREAM],
+                                 self.expected_metadata()[stream][self.STREAM],
+                                 msg="stream_name incorrect")
+                # verify the primary keys
+                self.assertEqual(set(catalog["metadata"][self.PRIMARY_KEYS]),
+                                 set(self.expected_metadata()[stream][self.PRIMARY_KEYS]),
+                                 msg="primary keys incorrect")
+
+                # verify that nothing is selected since this is the first discovery
+                self.assertTrue(all([catalog[self.SELECTED] is None,
+                                     catalog["metadata"][self.SELECTED] is None]))
+
+                schema_and_metadata = menagerie.get_annotated_schema(conn_id, catalog['stream_id'])
+                metadata = schema_and_metadata["metadata"]
+                # schema = schema_and_metadata["annotated-schema"]  # This is no longer relevant
+
+                # verify the stream level properties are as expected
+                # verify there is only 1 top level breadcrumb
+                stream_properties = [item for item in metadata if item.get("breadcrumb") == []]
+                self.assertTrue(len(stream_properties) == 1,
+                                msg="There is more than one top level breadcrumb")
+
+                # verify stream database name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.DATABASE_NAME: []}).get(self.DATABASE_NAME, []),
+                    self.expected_metadata()[stream][self.DATABASE_NAME],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.DATABASE_NAME],
+                        stream_properties[0].get(
+                            "metadata", {self.DATABASE_NAME: None}).get(self.DATABASE_NAME, [])))
+ 
+                # verify stream schema name
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.SCHEMA: []}).get(self.SCHEMA, []),
+                    self.expected_metadata()[stream][self.SCHEMA],
+                    msg="expected schema name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.SCHEMA],
+                        stream_properties[0].get(
+                            "metadata", {self.SCHEMA: None}).get(self.SCHEMA, [])))
+                
+                # verify stream primary keys
+                self.assertEqual(
+                    set(stream_properties[0].get(
+                        "metadata", {self.PRIMARY_KEYS: []}).get(self.PRIMARY_KEYS, [])),
+                    set(self.expected_primary_keys_by_stream_id()[stream]),
+                    msg="expected primary key s{} but actual is {}".format(
+                        set(self.expected_primary_keys_by_stream_id()[stream]),
+                        set(stream_properties[0].get(
+                            "metadata", {self.PRIMARY_KEYS: None}).get(self.PRIMARY_KEYS, []))))
+
+                # verify stream view or table
+                self.assertEqual(
+                    stream_properties[0].get(
+                        "metadata", {self.VIEW: []}).get(self.VIEW, []),
+                    self.expected_metadata()[stream][self.VIEW],
+                    msg="expected database name {} but actual is {}".format(
+                        self.expected_metadata()[stream][self.VIEW],
+                        stream_properties[0].get("metadata", {self.VIEW: None}).get(self.VIEW, [])))
+
+                # verify there is no forced replication method
+                self.assertTrue(stream_properties[0].get(
+                        "metadata", {self.REPLICATION_METHOD: []}).get(
+                    self.REPLICATION_METHOD) is None)
+
+                field_properties = [{item['breadcrumb'][1]: item['metadata']} for item in metadata
+                                    if item.get("breadcrumb")
+                                    and item.get("breadcrumb")[0] == 'properties']
+
+                for expected_field in self.expected_metadata()[stream][self.FIELDS]:
+                    with self.subTest(field=expected_field):
+
+                        actual_field = [field for field in field_properties
+                                        if field.keys() == expected_field.keys()].pop()
+                        self.assertEqual(
+                            dumps(actual_field, sort_keys=True),
+                            dumps(expected_field, sort_keys=True),
+                            msg="field metadata mismatches")
diff --git a/tests/test_discovery_unsupported_pks.py b/tests/test_discovery_unsupported_pks.py
new file mode 100644
index 0000000..1d5d733
--- /dev/null
+++ b/tests/test_discovery_unsupported_pks.py
@@ -0,0 +1,59 @@
+"""
+Test tap discovery
+"""
+
+from tap_tester import menagerie
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager
+
+from base import BaseTapTest
+
+
+class DiscoveryTestUnsupportedKeys(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_discovery_test_unsupported_pks".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        # drop_all_user_databases()
+        # database_name = "unsupported_pk_database"
+        # schema_name = "dbo"
+        #
+        # query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # # query_list.extend(create_schema(database_name, schema_name))
+        #
+        # table_name = "unsupported_pk"
+        # column_name = ["column_name"]
+        # column_type = ["datetimeoffset"]
+        # primary_key = {"column_name"}
+        # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+        #                                primary_key=primary_key))
+        # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+        #                           column_type, primary_key)
+        #
+        # mssql_cursor_context_manager(*query_list)
+        #
+        # cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Default Test Setup
+        Remove previous connections (with the same name)
+        Create a new connection (with the properties and credentials above)
+        Run discovery and ensure it completes successfully
+        """
+        print("running test {}".format(self.name()))
+        self.create_connection()
diff --git a/tests/test_full_replication.py b/tests/test_full_replication.py
new file mode 100644
index 0000000..3f5082e
--- /dev/null
+++ b/tests/test_full_replication.py
@@ -0,0 +1,259 @@
+"""
+Test tap gets all records for streams with full replication
+"""
+import json
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+from base import BaseTapTest
+
+
+class FullReplicationTest(BaseTapTest):
+    """Test tap gets all records for streams with full replication"""
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775807, 2147483647, 32767),
+                    (3, 3, None, None),
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyBigIntColumn': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'MyBigIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 255, True),
+                    (2, 42, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyTinyIntColumn': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MyTinyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        table_name = "integers"
+        column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a bookmark doesn't exist for the stream
+        Verify that the second sync includes the same number or more records than the first sync
+        Verify that all records in the first sync are included in the second sync
+        Verify that the sync only sent records to the target for selected streams (catalogs)
+
+        PREREQUISITE
+        For EACH stream that is fully replicated there are multiple rows of data with
+            different values for the replication key
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # Select all streams and no fields within streams
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        full_streams = {key for key, value in self.expected_replication_method().items()
+                        if value == self.FULL}
+        our_catalogs = [catalog for catalog in found_catalogs if
+                        catalog.get('tap_stream_id') in full_streams]
+        self.select_all_streams_and_fields(conn_id, our_catalogs, select_all_fields=True)
+
+        # Run a sync job using orchestrator
+        first_sync_record_count = self.run_sync(conn_id)
+
+        # verify that the sync only sent records to the target for selected streams (catalogs)
+        self.assertEqual(set(first_sync_record_count.keys()), full_streams)
+
+        first_sync_state = menagerie.get_state(conn_id)
+
+        # Get the set of records from a first sync
+        first_sync_records = runner.get_records_from_target_output()
+
+        # Get the fields for each stream from the first sync
+        actual_fields_by_stream = runner.examine_target_output_for_fields()
+
+        # Run a second sync job using orchestrator
+        second_sync_record_count = self.run_sync(conn_id)
+
+        # Get the set of records from a second sync
+        second_sync_records = runner.get_records_from_target_output()
+
+        # THIS MAKES AN ASSUMPTION THAT CHILD STREAMS DO NOT NEED TESTING.
+        # ADJUST IF NECESSARY
+        for stream in full_streams.difference(self.child_streams()):
+            with self.subTest(stream=stream):
+
+                # verify there is no bookmark values from state
+                state_value = first_sync_state.get("bookmarks", {}).get(stream)
+                self.assertIsNone(state_value)
+
+                # verify that there is more than 1 record of data - setup necessary
+                self.assertGreater(first_sync_record_count.get(stream, 0), 1,
+                                   msg="Data isn't set up to be able to test full sync")
+
+                # verify that you get the same or more data the 2nd time around
+                self.assertGreaterEqual(
+                    second_sync_record_count.get(stream, 0),
+                    first_sync_record_count.get(stream, 0),
+                    msg="second syc didn't have more records, full sync not verified")
+
+                # verify all data from 1st sync included in 2nd sync
+                first_data = [record["data"] for record
+                              in first_sync_records.get(stream, {}).get("messages", {"data": {}})]
+                second_data = [record["data"] for record
+                               in second_sync_records.get(stream, {}).get("messages", {"data": {}})]
+
+                same_records = 0
+                for first_record in first_data:
+                    first_value = json.dumps(first_record, sort_keys=True)
+
+                    for compare_record in second_data:
+                        compare_value = json.dumps(compare_record, sort_keys=True)
+
+                        if first_value == compare_value:
+                            second_data.remove(compare_record)
+                            same_records += 1
+                            break
+
+                self.assertEqual(len(first_data), same_records,
+                                 msg="Not all data from the first sync was in the second sync")
+
+                # verify we have more fields sent to the target than just automatic fields
+                # SKIP THIS ASSERTION IF ALL FIELDS ARE INTENTIONALLY AUTOMATIC FOR THIS STREAM
+                self.assertTrue(
+                    actual_fields_by_stream.get(stream, set()).symmetric_difference(
+                        self.expected_primary_keys().get(stream, set()) |
+                        self.expected_replication_keys().get(stream, set()) |
+                        self.expected_foreign_keys().get(stream, set())),
+                    msg="The fields sent to the target don't include non-automatic fields"
+                )
diff --git a/tests/test_pagination.py b/tests/test_pagination.py
new file mode 100644
index 0000000..c1858ed
--- /dev/null
+++ b/tests/test_pagination.py
@@ -0,0 +1,68 @@
+# TODO - There isn't pagination in this tap. This is NOT APPLICABLE (see NOTE below)
+# """
+# Test tap pagination of streams
+# """
+# from tap_tester import menagerie, runner
+
+
+# from base import BaseTapTest
+
+
+# class PaginationTest(BaseTapTest):
+#     """ Test the tap pagination to get multiple pages of data """
+
+#     def name(self):
+#         return "{}_pagination_test".format(super().name())
+
+#     def test_run(self):
+#         """
+#         Verify that for each stream you can get multiple pages of data
+#         and that when all fields are selected more than the automatic fields are replicated.
+
+#         PREREQUISITE
+#         For EACH stream add enough data that you surpass the limit of a single
+#         fetch of data.  For instance if you have a limit of 250 records ensure
+#         that 251 (or more) records have been posted for that stream.
+#         """
+#         print("running test {}".format(self.name()))
+
+#         conn_id = self.create_connection()
+
+#         # Select all streams and all fields within streams
+#         found_catalogs = menagerie.get_catalogs(conn_id)
+#         self.select_all_streams_and_fields(conn_id, found_catalogs, select_all_fields=True)
+
+#         # Run a sync job using orchestrator
+#         record_count_by_stream = self.run_sync(conn_id)
+
+#         actual_fields_by_stream = runner.examine_target_output_for_fields()
+
+#         for stream in self.expected_streams():
+#             with self.subTest(stream=stream):
+
+#                 # verify that we can paginate with all fields selected
+#                 self.assertGreater(
+#                     record_count_by_stream.get(stream, -1),
+#                     self.expected_metadata().get(stream, {}).get(self.API_LIMIT, 0),
+#                     msg="The number of records is not over the stream max limit")
+
+#                 # verify that the automatic fields are sent to the target
+#                 self.assertTrue(
+#                     actual_fields_by_stream.get(stream, set()).issuperset(
+#                         self.expected_primary_keys().get(stream, set()) |
+#                         self.expected_replication_keys().get(stream, set()) |
+#                         self.expected_foreign_keys().get(stream, set())),
+#                     msg="The fields sent to the target don't include all automatic fields"
+#                 )
+
+#                 # NOTE: THE FOLLOWING ASSERTION IS VALID EVEN THOUGH THE TEST IS NOT, MOVING TO test_full_replication.py
+
+#                 # verify we have more fields sent to the target than just automatic fields
+#                 # SKIP THIS ASSERTION IF ALL FIELDS ARE INTENTIONALLY AUTOMATIC FOR THIS STREAM
+#                 self.assertTrue(
+#                     actual_fields_by_stream.get(stream, set()).symmetric_difference(
+#                         self.expected_primary_keys().get(stream, set()) |
+#                         self.expected_replication_keys().get(stream, set()) |
+#                         self.expected_foreign_keys().get(stream, set())),
+#                     msg="The fields sent to the target don't include non-automatic fields"
+#                 )
diff --git a/tests/test_saas_stream.py b/tests/test_saas_stream.py
new file mode 100644
index 0000000..aa92853
--- /dev/null
+++ b/tests/test_saas_stream.py
@@ -0,0 +1,186 @@
+"""
+This module is a template of test objectives to complete
+for each stream of a SAAS API
+"""
+
+#
+# def test_discovery():
+#     """
+#     WIP
+#     # verify that the number of actual streams equals the number of expected streams
+#     # verify the actual stream names equal the expected stream names
+#     # stream names only have [a-z_]
+#     # verify that the annotated schema has the correct properties
+#     # verify that the metadata has the correct breadcrumbs / properties --
+#     # verify that non pk's and replication fields
+#       have inclusion as available in annotated schema.
+#     # verify that non pk's and replication fields
+#       have inclusion as available in metadata.
+#     # verify custom fields are in the schema - TBD
+#     # ensure schema doesn't allow extra types? - TBD
+#     """
+
+
+def test_stream_schema():
+    """
+    TOO MUCH WORK FOR THE VALUE OF THE TEST - MORE APPLICABLE IF THERE IS NO ALPHA TESTER
+    PREREQUISITE
+    For EACH stream populate the target endpoint with data in each field
+    with each expected data type allowed for that field.
+
+    For instance if an optional field can take a float from 0..100
+    sample data should include the endpoints of the range, null at a minimum.
+    Maybe the data can be stored as a string.
+        • 0
+        • 0.00001
+        • 100
+        • 99.9999999
+        • "100" (if possible)
+        • null value
+        • no key (if possible)
+
+    For date-times as an example we should try as many formats as we can to make
+    sure we can handle them correctly. Some examples might look like:
+        • 2018-04-25T13:51:12-04:00
+        • 20080915T155300
+        • 20080915T155300Z
+        • 2008-09-15
+        • null
+        • ""
+
+    TEST OBJECTIVES:
+        >> • Run a sync with all fields selected and verify there are no errors.
+        • verify the sync captured the setup data
+        • verify every field is present in the target data for the stream
+    """
+
+
+# def test_stream_pagination():
+#     """
+#     PREREQUISITE
+#     For EACH stream add enough data that you surpass the limit of a single
+#     fetch of data.  For instance if you have a limit of 250 records ensure
+#     that 251 records have been posted for that stream.
+#
+#     TEST OBJECTIVES:
+#         • Run a sync with ALL fields selected and
+#           verify that the number of records sent to the target
+#           exceeds the limit
+#     """
+
+
+# def test_only_selected_streams():
+#     """
+#     Verify that the tap only sends data to the target for selected streams
+#
+#     Think about child streams.  child without parent and vice versa.
+#     Think about this in combination with bookmarks.
+#     """
+
+
+# def test_stream_min_fields():
+#     """
+#     PREREQUISITE
+#     For EACH stream add enough data that you surpass the limit of a single
+#     fetch of data.  For instance if you have a limit of 250 records ensure
+#     that 251 records have been posted for that stream.
+#
+#     TEST OBJECTIVES:
+#         • Run a sync with NO fields selected (assuming there is at least 1
+#           automatic field, or 1 selected if there are no automatic fields)
+#           and verify that the number of records sent to the target
+#           exceeds the limit
+#         • Verify that automatic fields (or 1 selected)
+#           are the ONLY ones present in the target data for the stream
+#           (plus fields where selected-by-default metadata is set to true)
+#     """
+
+
+def test_field_conflicts():
+    """
+    PHASE 2
+
+    Test the business rules around field selection.
+    Verify that selecting field 1 means you can't select field 2
+    """
+
+
+# def test_stream_inc_bookmarks():
+#     """
+#     SOME VALUE - NOT SURE IF WE NEED TO TEST BOOKMARK USE. NEED TO ENSURE BOOKMARK SETTING
+#     PREREQUISITE
+#     For EACH stream that is incrementally replicated there are multiple rows of data.
+#
+#     NOTE: It is typical that there will be an automatic field that is used as the
+#           replication key (bookmark).  If this is not the case, and there are no
+#           automatic fields the sync should select a single field that is not
+#           the replication key.  (For example S3 uses a replication key that is the
+#           file modified date and may not have a primary key, in this case select
+#           a single field that isn't relevant to the modified date)
+#
+#     TEST STEPS
+#         • NOTE the start time of the test (for test_start_date below).
+#         • Run a sync with NO fields selected for each stream
+#           so that the bookmark is up to date
+#         • For each stream Update a subset of the records for the stream
+#           and note the number n where 0 < n < Total records
+#         • For each stream Insert m records 0 < m
+#         • NOTE n and m for each stream (for test_start_date below).
+#         • Run another sync
+#
+#     TEST OBJECTIVES:
+#         • Verify that the number of records returned in the second sync
+#           is equal to n + m + 1 above for each stream. (The tap can find updated
+#           records and do not get records that were not updated.)
+#     """
+
+
+# def test_start_date():
+#     """
+#     PREREQUISITE
+#     The test_stream_inc_bookmarks test has been run and no other data has been
+#     modified in the dev/test account since that test has been run
+#     and you have the start time from that test and the n + m values
+#     for each stream for that test.
+#
+#     TEST STEPS
+#         • Run a sync with the start date set to
+#           the start time of the test_stream_inc_bookmarks test
+#
+#     TEST OBJECTIVES:
+#         • Verify that the number of records returned in the sync
+#           is equal to n + m above for each stream.
+#     """
+
+#
+# def test_stream_full():
+#     """
+#     TEST BASED ON NOT SAVING STATE
+#     PREREQUISITE
+#     For EACH stream that is fully replicated there are multiple rows of data.
+#
+#     TEST STEPS
+#         • Run a sync for each stream
+#         • For each stream Update a subset of the records for the stream
+#           and note the number n where 0 < n < Total records
+#         • For each stream Insert m records 0 < m
+#         • Run another sync
+#
+#     TEST OBJECTIVES:
+#         • Verify that the number of records returned in the second sync
+#           is equal to the number of records in the first sync + m
+#     """
+
+
+def test_error_handling():
+    """TBD"""
+
+
+def test_performance():
+    """
+    TBD - This is probably not necessary in tap-tester as it would cause longer
+    run times.  This is something that would be useful to do manually.
+
+    Run a large set of data and ensure you don't run into memory leaks, disk
+    space issues, runs that take a long time to run.
+    """
diff --git a/tests/test_start_date.py b/tests/test_start_date.py
new file mode 100644
index 0000000..1c3022d
--- /dev/null
+++ b/tests/test_start_date.py
@@ -0,0 +1,123 @@
+# # TODO What the heck is this? We don't even have start_date in the ui. This isn't a configurable property
+# """
+# Test that the start_date configuration is respected
+# """
+
+# from functools import reduce
+
+# from dateutil.parser import parse
+
+# from tap_tester import menagerie, runner
+
+
+# from base import BaseTapTest
+
+
+# class StartDateTest(BaseTapTest):
+#     """
+#     Test that the start_date configuration is respected
+
+#     • verify that a sync with a later start date has at least one record synced
+#       and less records than the 1st sync with a previous start date
+#     • verify that each stream has less records than the earlier start date sync
+#     • verify all data from later start data has bookmark values >= start_date
+#     • verify that the minimum bookmark sent to the target for the later start_date sync
+#       is greater than or equal to the start date
+#     """
+
+#     def name(self):
+#         return "{}_start_date_test".format(super().name())
+
+#     def test_run(self):
+#         """Test we get a lot of data back based on the start date configured in base"""
+
+#         print("running test {}".format(self.name()))
+
+#         conn_id = self.create_connection()
+
+#         # Select all streams and all fields within streams
+#         found_catalogs = menagerie.get_catalogs(conn_id)
+#         incremental_streams = {key for key, value in self.expected_replication_method().items()
+#                                if value == self.INCREMENTAL}
+
+#         # IF THERE ARE STREAMS THAT SHOULD NOT BE TESTED
+#         # REPLACE THE EMPTY SET BELOW WITH THOSE STREAMS
+#         untested_streams = self.child_streams().union(set())
+#         our_catalogs = [catalog for catalog in found_catalogs if
+#                         catalog.get('tap_stream_id') in incremental_streams.difference(
+#                             untested_streams)]
+#         self.select_all_streams_and_fields(conn_id, our_catalogs, select_all_fields=True)
+
+#         # Run a sync job using orchestrator
+#         import pdb; pdb.set_trace()
+#         first_sync_record_count = self.run_sync(conn_id)
+#         first_total_records = reduce(lambda a, b: a + b, first_sync_record_count.values())
+
+#         # Count actual rows synced
+#         first_sync_records = runner.get_records_from_target_output()
+
+#         # set the start date for a new connection based off bookmarks largest value
+#         first_max_bookmarks = self.max_bookmarks_by_stream(first_sync_records)
+#         bookmark_list = [next(iter(book.values())) for stream, book in first_max_bookmarks.items()]
+#         bookmark_dates = []
+#         for bookmark in bookmark_list:
+#             try:
+#                 bookmark_dates.append(parse(bookmark))
+#             except (ValueError, OverflowError, TypeError):
+#                 pass
+
+#         if not bookmark_dates:
+#             # THERE WERE NO BOOKMARKS THAT ARE DATES.
+#             # REMOVE CODE TO FIND A START DATE AND ENTER ONE MANUALLY
+#             raise ValueError
+
+#         largest_bookmark = reduce(lambda a, b: a if a > b else b, bookmark_dates)
+#         self.start_date = self.local_to_utc(largest_bookmark).strftime(self.START_DATE_FORMAT)
+
+#         # create a new connection with the new start_date
+#         conn_id = self.create_connection(original_properties=False)
+
+#         # Select all streams and all fields within streams
+#         found_catalogs = menagerie.get_catalogs(conn_id)
+#         our_catalogs = [catalog for catalog in found_catalogs if
+#                         catalog.get('tap_stream_id') in incremental_streams.difference(
+#                             untested_streams)]
+#         self.select_all_streams_and_fields(conn_id, our_catalogs, select_all_fields=True)
+
+#         # Run a sync job using orchestrator
+#         second_sync_record_count = self.run_sync(conn_id)
+#         second_total_records = reduce(lambda a, b: a + b, second_sync_record_count.values(), 0)
+#         second_sync_records = runner.get_records_from_target_output()
+#         second_min_bookmarks = self.min_bookmarks_by_stream(second_sync_records)
+
+#         # verify that at least one record synced and less records synced than the 1st connection
+#         self.assertGreater(second_total_records, 0)
+#         self.assertLess(second_total_records, first_total_records)
+
+#         for stream in incremental_streams.difference(untested_streams):
+#             with self.subTest(stream=stream):
+
+#                 # verify that each stream has less records than the first connection sync
+#                 self.assertGreater(
+#                     first_sync_record_count.get(stream, 0),
+#                     second_sync_record_count.get(stream, 0),
+#                     msg="second had more records, start_date usage not verified")
+
+#                 # verify all data from 2nd sync >= start_date
+#                 target_mark = second_min_bookmarks.get(stream, {"mark": None})
+#                 target_value = next(iter(target_mark.values()))  # there should be only one
+
+#                 if target_value:
+
+#                     # it's okay if there isn't target data for a stream
+#                     try:
+#                         target_value = self.local_to_utc(parse(target_value))
+
+#                         # verify that the minimum bookmark sent to the target for the second sync
+#                         # is greater than or equal to the start date
+#                         self.assertGreaterEqual(target_value,
+#                                                 self.local_to_utc(parse(self.start_date)))
+
+#                     except (OverflowError, ValueError, TypeError):
+#                         print("bookmarks cannot be converted to dates, "
+#                               "can't test start_date for {}".format(stream))
diff --git a/tests/test_sync_full.py b/tests/test_sync_full.py
new file mode 100644
index 0000000..326c8c2
--- /dev/null
+++ b/tests/test_sync_full.py
@@ -0,0 +1,722 @@
+# """
+# Test tap discovery
+# """
+# import random
+# from datetime import date, datetime, timezone, time
+# from decimal import getcontext, Decimal
+# from json import dumps
+# from random import randint, sample
+#
+# import dateutil.tz
+# import sys
+#
+# from numpy import float32
+#
+# from tap_tester import menagerie, runner, connections
+# 
+# from tap_tester.suites.mssql.database import drop_all_user_databases, create_database, \
+#     create_table, mssql_cursor_context_manager, insert
+#
+# from base import BaseTapTest
+#
+#
+# class SyncTesFull(BaseTapTest):
+#     """ Test the tap discovery """
+#
+#     EXPECTED_METADATA = dict()
+#
+#     def name(self):
+#         return "{}_full_sync_test".format(super().name())
+#
+#     @classmethod
+#     def discovery_expected_metadata(cls):
+#         """The expected streams and metadata about the streams"""
+#
+#         return cls.EXPECTED_METADATA
+#
+#     @classmethod
+#     def setUpClass(cls) -> None:
+#         """Create the expected schema in the test database"""
+#         drop_all_user_databases()
+#         database_name = "data_types_database"
+#         schema_name = "dbo"
+#
+#         query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+#         # query_list.extend(create_schema(database_name, schema_name))
+#
+#         table_name = "integers"
+#         column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+#         column_type = ["int", "bigint", "int", "smallint"]
+#         # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1072
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # create data
+#         num_bytes = [8, 4, 2]  # bytes in a bigint, int, smallint and tinyint
+#         values = [
+#             (0, ) + tuple(-(2 ** (8 * size - 1)) for size in num_bytes),  # min
+#             (1, ) + tuple(0 for _ in num_bytes),  # 0
+#             (2, ) + tuple(2 ** (8 * size - 1) - 1 for size in num_bytes),  # max
+#             (3, None, None, None)  # null
+#         ]
+#         values.extend([(pk, ) + tuple(randint(-(2 ** (8 * size - 1)), 2 ** (8 * size - 1) - 1)
+#                                       for size in num_bytes)
+#                        for pk in range(4, 14)])  # random sample values
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         table_name = "tiny_integers_and_bools"
+#         column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+#         column_type = ["int", "tinyint", "bit"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # create data
+#         values = [
+#             (0, 0, False),  # min
+#             (1, 255, True),  # max
+#             (2, None, None)  # null
+#         ]
+#         values.extend([(pk, randint(0, 255), bool(randint(0, 1))) for pk in range(3, 13)])  # random sample values
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1075
+#         table_name = "numeric_precisions"
+#         precision_scale = [(precision, randint(0, precision)) for precision in (9, 15)]  # , 19, 28, 38)]
+#         column_type = [
+#             "numeric({},{})".format(precision, scale)
+#             for precision, scale in precision_scale
+#         ]
+#         column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+#         column_type = ["int"] + column_type
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # generate values for one precision at a time and then zip them together
+#         columns = []
+#         column = 0
+#         for precision, scale in precision_scale:
+#             getcontext().prec = precision
+#             columns.append([
+#                 Decimal(-10 ** precision + 1) / Decimal(10 ** scale),  # min
+#                 0,
+#                 None,
+#                 Decimal(10 ** precision - 1) / Decimal(10 ** scale)  # max
+#             ])
+#             columns[column].extend([Decimal(random.randint(-10 ** precision + 1, 10 ** precision - 1)) /
+#                                    Decimal(10 ** scale)
+#                                    for _ in range(10)])
+#             column = column + 1
+#
+#         values = list(zip(range(14), *columns))
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         table_name = "decimal_precisions"
+#         precision_scale = [(precision, randint(0, precision)) for precision in (9, 15)]  # 19, 28, 38)]
+#         column_type = [
+#             "decimal({},{})".format(precision, scale)
+#             for precision, scale in precision_scale
+#         ]
+#         column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+#         column_type = ["int"] + column_type
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # generate values for one precision at a time and then zip them together
+#         columns = []
+#         column = 0
+#         for precision, scale in precision_scale:
+#             getcontext().prec = precision
+#             columns.append([
+#                 Decimal(-10 ** precision + 1) / Decimal(10 ** scale),  # min
+#                 0,
+#                 None,
+#                 Decimal(10 ** precision - 1) / Decimal(10 ** scale)  # max
+#             ])
+#             columns[column].extend([Decimal(random.randint(-10 ** precision + 1, 10 ** precision - 1)) /
+#                                     Decimal(10 ** scale)
+#                                     for _ in range(10)])
+#             column = column + 1
+#
+#         values = list(zip(range(14), *columns))
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1078
+#         table_name = "float_precisions"
+#         column_name = ["pk", "float_24", "float_53", "real_24_bits"]
+#         column_type = ["int", "float(24)", "float(53)", "real"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # create data
+#         values = [
+#             (0,
+#              float(str(float32(1.175494351e-38))),
+#              2.2250738585072014e-308,
+#              float(str(float32(1.175494351e-38)))),  # min positive
+#             (1, float(str(float32(3.402823466e+38))), 1.7976931348623158e+308, float(str(float32(3.402823466e+38)))),  # max positive
+#             (2, float(str(float32(-1.175494351e-38))), -2.2250738585072014e-308, float(str(float32(-1.175494351e-38)))),  # smallest negative
+#             (3, float(str(float32(-3.402823466e+38))), -1.7976931348623158e+308, float(str(float32(-3.402823466e+38)))),  # largest negative
+#             (4, 0.0, 0.0, 0.0),  # 0
+#             (5, None, None, None),  # Null
+#             # (float("Inf"), -float("Inf"), float('NaN'))
+#         ]
+#
+#         # # random small positive values
+#         # values.extend([(
+#         #     pk,
+#         #     random.uniform(1.175494351e-38, 10 ** random.randint(-37, 0)),
+#         #     random.uniform(2.2250738585072014e-308, 10 ** random.randint(-307, 0)),
+#         #     random.uniform(1.175494351e-38, 10 ** random.randint(-37, 0))
+#         #     ) for pk in range(6, 11)
+#         # ])
+#         #
+#         # # random large positive values
+#         # values.extend([(
+#         #     pk,
+#         #     random.uniform(1, 10 ** random.randint(0, 38)),
+#         #     random.uniform(1, 10 ** random.randint(0, 308)),
+#         #     random.uniform(1, 10 ** random.randint(0, 38))
+#         #     ) for pk in range(11, 16)
+#         # ])
+#         #
+#         # # random small negative values
+#         # values.extend([(
+#         #     pk,
+#         #     random.uniform(-1.175494351e-38, -1 * 10 ** random.randint(-37, 0)),
+#         #     random.uniform(-2.2250738585072014e-308, -1 * 10 ** random.randint(-307, 0)),
+#         #     random.uniform(-1.175494351e-38, -1 * 10 ** random.randint(-37, 0))
+#         #     ) for pk in range(16, 21)
+#         # ])
+#         #
+#         # # random large negative values
+#         # values.extend([(
+#         #     pk,
+#         #     random.uniform(-1,  -1 *10 ** random.randint(0, 38)),
+#         #     random.uniform(-1,  -1 *10 ** random.randint(0, 308)),
+#         #     random.uniform(-1,  -1 *10 ** random.randint(0, 38))
+#         #     ) for pk in range(21, 26)
+#         # ])
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1080
+#         # table_name = "dates_and_times"
+#         # column_name = ["just_a_date", "date_and_time", "bigger_range_and_precision_datetime",
+#         #                "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+#         # column_type = ["date", "datetime", "datetime2", "datetimeoffset", "smalldatetime", "time"]
+#         #
+#         # # TODO - remove this once more datetime types are supported. Also, things shouldn't blow up
+#         # #   when they aren't supported
+#         # column_name = ["pk", "just_a_date", "date_and_time", "its_time"]
+#         # column_type = ["int", "date", "datetime", "time"]
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         #
+#         # # create data
+#         # values = [
+#         #     (
+#         #         0,
+#         #         date(1, 1, 1),
+#         #         datetime(1753, 1, 1, 0, 0, 0, 0, tzinfo=timezone.utc),
+#         #         # datetime(1, 1, 1, 0, 0, 0, 0, tzinfo=timezone.utc),
+#         #         # datetime.fromtimestamp(
+#         #         #     datetime(1, 1, 1, 14, 0, 0, 0, tzinfo=timezone.utc).timestamp(),
+#         #         #     tz=dateutil.tz.tzoffset(None, -14*60)),
+#         #         # datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+#         #         time(0, 0, 0, 0, tzinfo=timezone.utc),
+#         #     ),  # min
+#         #     (
+#         #         1,
+#         #         date(9999, 12, 31),
+#         #         datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+#         #         # datetime(9999, 12, 31, 23, 59, 59, 999999, tzinfo=timezone.utc),
+#         #         # datetime.fromtimestamp(
+#         #         #     datetime(9999, 12, 31, 9, 59, 59, 999999, tzinfo=timezone.utc).timestamp(),
+#         #         #     tz=dateutil.tz.tzoffset(None, 14*60)),
+#         #         # datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+#         #         time(23, 59, 59, 999999, tzinfo=timezone.utc),
+#         #     ),  # max
+#         #     (2, None, None, None)  # , None, None, None),  # Null
+#         # ]
+#         #
+#         # # TODO - make some random samples...
+#         #
+#         # query_list.extend(insert(database_name, schema_name, table_name, values))
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key, values)
+#
+#         table_name = "char_data"
+#         column_name = ["pk", "char_2"]  # , "char_8000"]
+#         column_type = ["int", "char(2)"]  # , "char(8000)"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         # use all valid unicode characters
+#         chars = list(range(0, 55296))
+#         chars.extend(range(57344, sys.maxunicode))
+#         chars.reverse()
+#
+#         values = [(pk, "".join([chr(chars.pop()) for _ in range(2)])) for pk in range(16)]
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#
+#         table_name = "varchar_data"
+#         column_name = ["pk", "varchar_5", "varchar_8000", "varchar_max"]
+#         column_type = ["int", "varchar(5)", "varchar(8000)", "varchar(max)"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#
+#         values = [
+#             (pk,
+#              chr(chars.pop()),
+#              "".join([chr(chars.pop()) for _ in range(15)]),
+#              "".join([chr(chars.pop()) for _ in range(randint(1, 16))])
+#              ) for pk in range(3)
+#         ]
+#         values.extend([(50, None, None, None), ])
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # table_name = "nchar_data"
+#         # column_name = ["pk", "nchar_8"]  # , "nchar_4000"]
+#         # column_type = ["int", "nchar(8)"]  # , "nchar(4000)"]
+#         # primary_key = {"pk"}
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # values = [
+#         #     (pk,
+#         #      "".join([chr(chars.pop()) for _ in range(4)])) #chr(chars.pop()))  # , "".join([chr(chars.pop()) for _ in range(1500)]))
+#         #     for pk in range(1)
+#         # ]
+#         # # values.extend([(50, None, None), ])
+#         # query_list.extend(insert(database_name, schema_name, table_name, values))
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key, values)
+#         #
+#         table_name = "nvarchar_data"
+#         column_name = ["pk", "nvarchar_5", "nvarchar_4000", "nvarchar_max"]
+#         column_type = ["int", "nvarchar(5)", "nvarchar(4000)", "nvarchar(max)"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#         chars.reverse()
+#         values = [
+#             (pk,
+#              chr(chars.pop()),
+#              "".join([chr(chars.pop()) for _ in range(8)]),
+#              "".join([chr(chars.pop()) for _ in range(randint(1, 8))])
+#              ) for pk in range(1)
+#         ]
+#         values.extend([(50, None, None, None), ])
+#
+#         # pk = 51
+#         # while len(chars):
+#         #     #  Use the rest of the characters
+#         #     values.extend([(
+#         #         pk,
+#         #         chr(chars.pop()),
+#         #         "".join([chr(chars.pop()) for _ in range(min(len(chars), 800))]) if len(chars) else "",
+#         #         "".join([chr(chars.pop()) for _ in range(min(len(chars), randint(1, 800)))]) if len(chars) else "",
+#         #         "".join([chr(chars.pop()) for _ in range(min(len(chars), randint(1, random_types[0] // 10)))]),
+#         #         "".join([chr(chars.pop()) for _ in range(min(len(chars), randint(1, random_types[1] // 10)))]),
+#         #         "".join([chr(chars.pop()) for _ in range(min(len(chars), randint(1, random_types[2] // 10)))])
+#         #     )])
+#         #     pk += 1
+#
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # query_list.extend(['-- there are {} characters left to test'.format(len(chars))])
+#         #
+#         #
+#         table_name = "money_money_money"
+#         column_name = ["pk", "cash_money", "change"]
+#         column_type = ["int", "money", "smallmoney"]
+#         primary_key = {"pk"}
+#         column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#                                        primary_key=primary_key))
+#         values = [
+#             (0, 123.45, 0.99),
+#             (1, 123213.99, 0.00)
+#         ]
+#         query_list.extend(insert(database_name, schema_name, table_name, values))
+#         column_name = ["pk"]
+#         column_type = ["int"]
+#         values = [
+#             (0, ),
+#             (1, )
+#         ]
+#         cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#                                   column_type, primary_key, values)
+#
+#         # table_name = "binary_data"
+#         # column_name = ["binary_1", "binary_8000"]
+#         # column_type = ["binary(1)", "binary(8000)"]
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key)
+#         #
+#         # table_name = "varbinary_data"
+#         # column_name = ["varbinary_1", "varbinary_8000", "varbinary_max"]
+#         # column_type = ["varbinary(1)", "varbinary(8000)", "varbinary(max)"]
+#         # random_types = [x for x in sample(range(1, 8000), 3)]
+#         # column_name.extend(["varbinary_{0}".format(x) for x in random_types])
+#         # column_type.extend(["varbinary({0})".format(x) for x in random_types])
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key)
+#         #
+#         # table_name = "text_and_image_deprecated_soon"
+#         # column_name = ["nvarchar_text", "varchar_text", "varbinary_data",
+#         #                "rowversion_synonym_timestamp"]
+#         # column_type = ["ntext", "text", "image", "timestamp"]
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key)
+#         #
+#         # table_name = "weirdos"
+#         # column_name = [
+#         #     "geospacial", "geospacial_map", "markup", "guid", "version", "tree",
+#         #     "variant", "SpecialPurposeColumns"
+#         # ]
+#         # column_type = [
+#         #     "geometry", "geography", "xml", "uniqueidentifier", "rowversion", "hierarchyid",
+#         #     "sql_variant", "xml COLUMN_SET FOR ALL_SPARSE_COLUMNS"
+#         # ]
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # column_type[7] = "xml"  # this is the underlying type
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key)
+#         #
+#         # table_name = "computed_columns"
+#         # column_name = ["started_at", "ended_at", "durations_days"]
+#         # column_type = ["datetimeoffset", "datetimeoffset", "AS DATEDIFF(day, started_at, ended_at)"]
+#         # primary_key = set()
+#         # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+#         # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+#         #                                primary_key=primary_key))
+#         # column_type[2] = "int"  # this is the underlying type of a datediff
+#         # cls.add_expected_metadata(cls, database_name, schema_name, table_name, column_name,
+#         #                           column_type, primary_key)
+#
+#         mssql_cursor_context_manager(*query_list)
+#
+#         cls.expected_metadata = cls.discovery_expected_metadata
+#
+#     def test_run(self):
+#         """
+#         Verify that a full sync can send capture all data and send it in the correct format
+#         """
+#
+#         # run in check mode
+#         check_job_name = runner.run_check_mode(self, conn_id)
+#
+#         # verify check  exit codes
+#         exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+#         menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+#
+#         # get the catalog information of discovery
+#         found_catalogs = menagerie.get_catalogs(conn_id)
+#         found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+#
+#         # verify that persisted streams have the correct properties
+#         test_catalog = found_catalogs[0]
+#
+#         additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+#         BaseTapTest.select_all_streams_and_fields(
+#             conn_id, found_catalogs, additional_md=additional_md,
+#             non_selected_properties=["cash_money", "change"])
+#
+#         # clear state
+#         menagerie.set_state(conn_id, {})
+#         sync_job_name = runner.run_sync_mode(self, conn_id)
+#
+#         # verify tap and target exit codes
+#         exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+#         menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+#
+#         # verify record counts of streams
+#         record_count_by_stream = runner.examine_target_output_file(
+#             self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+#         expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+#         self.assertEqual(record_count_by_stream, expected_count)
+#
+#         # verify records match on the first sync
+#         records_by_stream = runner.get_records_from_target_output()
+#
+#         for stream in self.expected_streams():
+#             with self.subTest(stream=stream):
+#                 stream_expected_data = self.expected_metadata()[stream]
+#                 # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+#                 #   This needs to be consistent based on replication method so you can change replication methods
+#                 table_version = records_by_stream[stream]['table_version']
+#
+#                 # verify on the first sync you get activate version message before and after all data
+#                 self.assertEqual(
+#                     records_by_stream[stream]['messages'][0]['action'],
+#                     'activate_version')
+#                 self.assertEqual(
+#                     records_by_stream[stream]['messages'][-1]['action'],
+#                     'activate_version')
+#                 column_names = [
+#                     list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+#                 ]
+#
+#                 expected_messages = [
+#                     {
+#                         "action": "upsert", "data":
+#                         {
+#                             column: value for column, value
+#                             in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+#                         }
+#                     } for row in range(len(stream_expected_data[self.VALUES]))
+#                 ]
+#
+#                 # remove sequences from actual values for comparison
+#                 [message.pop("sequence") for message
+#                  in records_by_stream[stream]['messages'][1:-1]]
+#
+#                 # Verify all data is correct
+#                 for expected_row, actual_row in list(
+#                         zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+#                     with self.subTest(expected_row=expected_row):
+#                         self.assertEqual(actual_row["action"], "upsert")
+#                         self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+#                                          msg="there are not the same number of columns")
+#
+#                         for column_name, expected_value in expected_row["data"].items():
+#                             column_index = [list(key.keys())[0] for key in
+#                                             self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+#
+#                             if isinstance(expected_value, Decimal):
+#                                 self.assertEqual(type(actual_row["data"][column_name]), float,
+#                                                  msg="decimal value is not represented as a number")
+#                                 self.assertEqual(expected_value, Decimal(str(actual_row["data"][column_name])),
+#                                                  msg="expected: {} != actual {}".format(
+#                                                      expected_row, actual_row))
+#                             elif self.expected_metadata()[stream][self.FIELDS][column_index
+#                                     ][column_name][self.DATATYPE] == "real":
+#                                 if actual_row["data"][column_name] is None:
+#                                     self.assertEqual(expected_value, actual_row["data"][column_name],
+#                                                      msg="expected: {} != actual {}".format(
+#                                                          expected_row, actual_row))
+#                                 else:
+#                                     self.assertEqual(type(actual_row["data"][column_name]), float,
+#                                                      msg="float value is not represented as a number")
+#                                     self.assertEqual(float(str(float32(expected_value))),
+#                                                      float(str(float32(actual_row["data"][column_name]))),
+#                                                      msg="single value of {} doesn't match actual {}".format(
+#                                                          float(str(float32(expected_value))),
+#                                                          float(str(float32(actual_row["data"][column_name]))))
+#                                                      )
+#                             else:
+#                                 self.assertEqual(expected_value, actual_row["data"][column_name],
+#                                                  msg="expected: {} != actual {}".format(
+#                                                      expected_row, actual_row))
+#                 print("records are correct for stream {}".format(stream))
+#
+#                 # verify state and bookmarks
+#                 state = menagerie.get_state(conn_id)
+#
+#                 bookmark = state['bookmarks'][stream]
+#
+#                 self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+#                 # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+#                 self.assertIsNone(
+#                     bookmark.get('lsn'),
+#                     msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+#
+#                 self.assertEqual(bookmark['version'], table_version,
+#                                  msg="expected bookmark for stream to match version")
+#
+#                 expected_schemas = {
+#                     "selected": True,
+#                     "type": "object",
+#                     "properties": {
+#                         k: dict(
+#                             **self.DATATYPE_SCHEMAS[v["sql-datatype"]],
+#                             selected=True,
+#                             inclusion=v["inclusion"]
+#                         )
+#                         for fd in stream_expected_data[self.FIELDS] for k, v in fd.items()
+#                     }
+#                 }
+#
+#                 # I made everything nullable except pks.  Based on this the DATATYPE_SCHEMAS reflects nullable types
+#                 # we need to update the pk to be not nullable
+#                 expected_schemas["properties"]["pk"]["type"] = ["integer"]
+#                 self.assertEqual(records_by_stream[stream]['schema'],
+#                                  expected_schemas,
+#                                  msg="expected: {} != actual: {}".format(expected_schemas,
+#                                                                          records_by_stream[stream]['schema']))
+#
+#         # ----------------------------------------------------------------------
+#         # invoke the sync job AGAIN and get the same 3 records
+#         # ----------------------------------------------------------------------
+#         # TODO - update the table to add a column and ensure that discovery adds the new column
+#         sync_job_name = runner.run_sync_mode(self, conn_id)
+#
+#         # verify tap and target exit codes
+#         exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+#         menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+#         record_count_by_stream = runner.examine_target_output_file(
+#             self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+#         expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+#         self.assertEqual(record_count_by_stream, expected_count)
+#         records_by_stream = runner.get_records_from_target_output()
+#
+#         for stream in self.expected_streams():
+#             with self.subTest(stream=stream):
+#                 stream_expected_data = self.expected_metadata()[stream]
+#                 # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+#                 #   This needs to be consistent based on replication method so you can change replication methods
+#                 # {'action': 'upsert', 'sequence': 1560362044666000001, 'data': {'MySmallIntColumn': 0, 'pk': 1, 'MyIntColumn': 0, 'MyBigIntColumn': 0}}
+#
+#                 new_table_version = records_by_stream[stream]['table_version']
+#
+#                 # verify on a subsequent sync you get activate version message only after all data
+#                 self.assertEqual(
+#                     records_by_stream[stream]['messages'][0]['action'],
+#                     'upsert')
+#                 self.assertEqual(
+#                     records_by_stream[stream]['messages'][-1]['action'],
+#                     'activate_version')
+#                 column_names = [
+#                     list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+#                 ]
+#
+#                 expected_messages = [
+#                     {
+#                         "action": "upsert", "data":
+#                         {
+#                             column: value for column, value
+#                             in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+#                         }
+#                     } for row in range(len(stream_expected_data[self.VALUES]))
+#                 ]
+#
+#                 # remove sequences from actual values for comparison
+#                 [message.pop("sequence") for message
+#                  in records_by_stream[stream]['messages'][0:-1]]
+#
+#                 # Verify all data is correct
+#                 for expected_row, actual_row in list(
+#                         zip(expected_messages, records_by_stream[stream]['messages'][0:-1])):
+#                     with self.subTest(expected_row=expected_row):
+#                         self.assertEqual(actual_row["action"], "upsert")
+#                         self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+#                                          msg="there are not the same number of columns")
+#
+#                         for column_name, expected_value in expected_row["data"].items():
+#                             column_index = [list(key.keys())[0] for key in
+#                                             self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+#
+#                             if isinstance(expected_value, Decimal):
+#                                 self.assertEqual(type(actual_row["data"][column_name]), float,
+#                                                  msg="decimal value is not represented as a number")
+#                                 self.assertEqual(expected_value, Decimal(str(actual_row["data"][column_name])),
+#                                                  msg="expected: {} != actual {}".format(
+#                                                      expected_row, actual_row))
+#                             elif self.expected_metadata()[stream][self.FIELDS][column_index
+#                             ][column_name][self.DATATYPE] == "real":
+#                                 if actual_row["data"][column_name] is None:
+#                                     self.assertEqual(expected_value, actual_row["data"][column_name],
+#                                                      msg="expected: {} != actual {}".format(
+#                                                          expected_row, actual_row))
+#                                 else:
+#                                     self.assertEqual(type(actual_row["data"][column_name]), float,
+#                                                      msg="float value is not represented as a number")
+#                                     self.assertEqual(float(str(float32(expected_value))),
+#                                                      float(str(float32(actual_row["data"][column_name]))),
+#                                                      msg="single value of {} doesn't match actual {}".format(
+#                                                          float(str(float32(expected_value))),
+#                                                          float(str(float32(actual_row["data"][column_name]))))
+#                                                      )
+#                             else:
+#                                 self.assertEqual(expected_value, actual_row["data"][column_name],
+#                                                  msg="expected: {} != actual {}".format(
+#                                                      expected_row, actual_row))
+#                 print("records are correct for stream {}".format(stream))
+#
+#                 # verify state and bookmarks
+#                 state = menagerie.get_state(conn_id)
+#
+#                 bookmark = state['bookmarks'][stream]
+#                 self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+#
+#                 self.assertIsNone(
+#                     bookmark.get('lsn'),
+#                     msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+#                 self.assertGreater(new_table_version, table_version,
+#                                    msg="table version {} didn't increate from {} on the second run".format(
+#                                        new_table_version,
+#                                        table_version))
+#                 self.assertEqual(bookmark['version'], new_table_version,
+#                                  msg="expected bookmark for stream to match version")
+#
+#                 expected_schemas = {
+#                     "selected": True,
+#                     "type": "object",
+#                     "properties": {
+#                         k: dict(
+#                             **self.DATATYPE_SCHEMAS[v["sql-datatype"]],
+#                             selected=True,
+#                             inclusion=v["inclusion"]
+#                         )
+#                         for fd in stream_expected_data[self.FIELDS] for k, v in fd.items()
+#                     }
+#                 }
+#
+#                 # I made everything nullable except pks.  Based on this the DATATYPE_SCHEMAS reflects nullable types
+#                 # we need to update the pk to be not nullable
+#                 expected_schemas["properties"]["pk"]["type"] = ["integer"]
+#                 self.assertEqual(records_by_stream[stream]['schema'],
+#                                  expected_schemas,
+#                                  msg="expected: {} != actual: {}".format(expected_schemas,
+#                                                                          records_by_stream[stream]['schema']))
+#
+#
+# # SCENARIOS.add(SyncTesFull) THIS TEST WAS RE-WRITTEN IN SMALLER PARTS
diff --git a/tests/test_sync_full_datetime.py b/tests/test_sync_full_datetime.py
new file mode 100644
index 0000000..5aefae2
--- /dev/null
+++ b/tests/test_sync_full_datetime.py
@@ -0,0 +1,312 @@
+"""
+Test tap discovery
+"""
+
+from datetime import date, datetime, timezone, time, timedelta
+from dateutil.tz import tzoffset
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+
+class SyncDateFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_datetime_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).isoformat(),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).isoformat(),
+                datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102386, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546280, tzinfo=timezone(timedelta(hours=6, minutes=15))).isoformat(),
+                datetime(2024, 6, 22, 0, 36, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+
+        schema = {
+            'selected': True,
+            'properties': {
+                'its_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null']},
+                'pk': {
+                    'maximum': 2147483647,
+                    'selected': True,
+                    'inclusion': 'automatic',
+                    'type': ['integer'],
+                    'minimum': -2147483648},
+                'just_a_date': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                'date_and_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "bigger_range_and_precision_datetime": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_with_timezones": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_no_seconds": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'}},
+            'type': 'object'}
+
+        fields = [
+            {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+            {'just_a_date': {'sql-datatype': 'date', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'date_and_time': {'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'bigger_range_and_precision_datetime': {'sql-datatype': 'datetime2', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_with_timezones': {'sql-datatype': 'datetimeoffest', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_no_seconds': {'sql-datatype': 'smalldatetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'its_time': {'sql-datatype': 'time', 'selected-by-default': True, 'inclusion': 'available'}}]
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "dates_and_times"
+        primary_key = {"pk"}
+
+        column_name = ["pk", "just_a_date", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        column_type = ["int", "date", "datetime", "datetime2", "datetimeoffset", "smalldatetime", "time"]
+
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, values))
+
+        mssql_cursor_context_manager(*query_list)
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).astimezone(timezone.utc),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110809,
+                         tzinfo=timezone(timedelta(hours=10, minutes=5))).astimezone(timezone.utc),
+                datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102386, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546280,
+                         tzinfo=timezone(timedelta(hours=6, minutes=15))).astimezone(timezone.utc),
+                datetime(2024, 6, 22, 0, 36, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': primary_key,
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': fields,
+                'schema': schema}
+        }
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                                     actual_row["data"][column_name]))
+                            elif isinstance(expected_value, time):
+                                # sql server time has second resolution only
+                                self.assertEqual(expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat().replace('+00:00', 'Z'),
+                                                     actual_row["data"][column_name]))
+                            elif isinstance(expected_value, date):
+                                # sql server time has second resolution only
+                                self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat() + 'T00:00:00+00:00',
+                                                     actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value, actual_row["data"][column_name]))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_decimal.py b/tests/test_sync_full_decimal.py
new file mode 100644
index 0000000..5f0c4ab
--- /dev/null
+++ b/tests/test_sync_full_decimal.py
@@ -0,0 +1,424 @@
+"""
+Test tap discovery
+"""
+
+from decimal import getcontext, Decimal
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+import simplejson
+
+getcontext().prec = 38
+
+
+class SyncDecimalFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_decimal_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        numeric_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999.999999999999'), Decimal('-999999.9999999999999999999999'), Decimal('-99999999999999999999999999999999999.999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9999'), Decimal('9999999.999999999999'), Decimal('999999.9999999999999999999999'), Decimal('99999999999999999999999999999999999.999')),
+            (4, Decimal('96701.9382'), Decimal('-4371716.186100650268'), Decimal('-367352.306093776232045517794'), Decimal('-81147872128956247517327931319278572.985')),
+            (5, Decimal('-73621.9366'), Decimal('2564047.277589545531'), Decimal('336177.4754683699464233786667'), Decimal('46946462608534127558389411015159825.758')),
+            (6, Decimal('-3070.7339'), Decimal('6260062.158440967433'), Decimal('-987006.0035971607740533206418'), Decimal('95478671259010046866787754969592794.61'))]
+        numeric_precision_scale = [(9, 4), (19, 12), (28, 22), (38, 3)]
+
+        # TODO - Remove this workaround when we fix decimal precision and to test
+        # numeric_values = [
+        #     (0, Decimal('-9999999.99'), Decimal('-9999999999999.99')),
+        #     (1, 0, 0),
+        #     (2, None, None),
+        #     (3, Decimal('9999999.99'), Decimal('9999999999999.99')),
+        #     (4, Decimal('-4133076.27'), Decimal('8499042653781.28')),
+        #     (5, Decimal('-8629188.35'), Decimal('-4589639716080.97')),
+        #     (6, Decimal('-9444926.01'), Decimal('7151189415270.4'))]
+        # numeric_precision_scale = [(9, 2), (15, 2)]
+        numeric_schema = {
+            'type': 'object',
+            'properties': {
+                'numeric_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'numeric_19_12': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-12,
+                    'maximum': 1e7,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e7},
+                'numeric_28_22': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-22,
+                    'maximum': 1e6,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e6},
+                'numeric_38_3': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': .001,
+                    'maximum': 1e35,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e35},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True}},
+            'selected': True}
+        # numeric_schema = {
+        #     'type': 'object',
+        #     'properties': {
+        #         'numeric_9_2': {
+        #             'exclusiveMaximum': True,
+        #             'type': ['number', 'null'],
+        #             'selected': True,
+        #             'multipleOf': 0.01,
+        #             'maximum': 10000000,
+        #             'inclusion': 'available',
+        #             'exclusiveMinimum': True,
+        #             'minimum': -10000000},
+        #         'numeric_15_2': {
+        #             'exclusiveMaximum': True,
+        #             'type': ['number', 'null'],
+        #             'selected': True,
+        #             'multipleOf': 0.01,
+        #             'maximum': 10000000000000,
+        #             'inclusion': 'available',
+        #             'exclusiveMinimum': True,
+        #             'minimum': -10000000000000},
+        #         'pk': {
+        #             'maximum': 2147483647,
+        #             'type': ['integer'],
+        #             'inclusion': 'automatic',
+        #             'minimum': -2147483648,
+        #             'selected': True}},
+        #     'selected': True}
+
+        decimal_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999999999.999999'), Decimal('-9999999999999999999999.999999'), Decimal('-9999999999999999999999999.9999999999999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9999'), Decimal('9999999999999.999999'), Decimal('9999999999999999999999.999999'), Decimal('9999999999999999999999999.9999999999999')),
+            (4, Decimal('-92473.8401'), Decimal('-4182159664734.645653'), Decimal('6101329656084900380190.268036'), Decimal('4778017533841887320066645.9761464001349')),
+            (5, Decimal('-57970.8157'), Decimal('7735958802279.086687'), Decimal('4848737828398517845540.057905'), Decimal('2176036096567853905237453.5152648989022')),
+            (6, Decimal('57573.9037'), Decimal('5948502499261.181557'), Decimal('-6687721783088280707003.076638'), Decimal('-6264019242578746090842245.3746225058202'))]
+        decimal_precision_scale = [(9, 4), (19, 6), (28, 6), (38, 13)]
+
+        # TODO - Remove this workaround when we fix decimal precision and to test
+        # decimal_values = [
+        #     (0, Decimal('-9999.99999'), Decimal('-999999999999.999')),
+        #     (1, 0, 0),
+        #     (2, None, None),
+        #     (3, Decimal('9999.99999'), Decimal('999999999999.999')),
+        #     (4, Decimal('7191.0647'), Decimal('284159490729.628')),
+        #     (5, Decimal('6470.19405'), Decimal('-631069143780.173')),
+        #     (6, Decimal('4708.67525'), Decimal('-570692336616.609'))]
+        # decimal_precision_scale = [(9, 5), (15, 3)]
+        decimal_schema = {
+            'type': 'object',
+            'properties': {
+                'decimal_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'decimal_19_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e13,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e13},
+                'decimal_28_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e22,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e22},
+                'decimal_38_13': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-13,
+                    'maximum': 1e25,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e25},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True}},
+            'selected': True}
+        # decimal_schema = {
+        #     'type': 'object',
+        #     'properties': {
+        #         'decimal_15_3': {
+        #             'exclusiveMaximum': True,
+        #             'type': ['number', 'null'],
+        #             'selected': True,
+        #             'multipleOf': 0.001,
+        #             'maximum': 1000000000000,
+        #             'inclusion': 'available',
+        #             'exclusiveMinimum': True,
+        #             'minimum': -1000000000000},
+        #         'decimal_9_5': {
+        #             'exclusiveMaximum': True,
+        #             'type': ['number', 'null'],
+        #             'selected': True,
+        #             'multipleOf': 1e-05,
+        #             'maximum': 10000,
+        #             'inclusion': 'available',
+        #             'exclusiveMinimum': True, 'minimum': -10000},
+        #         'pk': {
+        #             'maximum': 2147483647,
+        #             'type': ['integer'],
+        #             'inclusion': 'automatic',
+        #             'minimum': -2147483648,
+        #             'selected': True}},
+        #     'selected': True}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_numeric_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': numeric_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'numeric_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'numeric_9_4': {'sql-datatype': 'numeric(9,4)', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'numeric_19_12': {'sql-datatype': 'numeric(19,12)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'numeric_28_22': {'sql-datatype': 'numeric(28,22)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'numeric_38_3': {'sql-datatype': 'numeric(38,3)', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': numeric_schema},
+            'data_types_database_dbo_decimal_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': decimal_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'decimal_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'decimal_9_4': {'sql-datatype': 'decimal(9,4)', 'selected-by-default': True,
+                                     'inclusion': 'available'}},
+                    {'decimal_19_6': {'sql-datatype': 'decimal(19,6)', 'selected-by-default': True,
+                                      'inclusion': 'available'}},
+                    {'decimal_28_6': {'sql-datatype': 'decimal(28,6)', 'selected-by-default': True,
+                                       'inclusion': 'available'}},
+                    {'decimal_38_13': {'sql-datatype': 'decimal(38,13)', 'selected-by-default': True,
+                                      'inclusion': 'available'}}],
+                'schema': decimal_schema}}
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1075
+        table_name = "numeric_precisions"
+        precision_scale = numeric_precision_scale
+        column_type = [
+            "numeric({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["values"]))
+
+        table_name = "decimal_precisions"
+        precision_scale = decimal_precision_scale
+        column_type = [
+            "decimal({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, Decimal):
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="decimal value is not represented as a number")
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = {
+                    "selected": True,
+                    "type": "object",
+                    "properties": {
+                        k: dict(
+                            **self.DATATYPE_SCHEMAS[v["sql-datatype"]],
+                            selected=True,
+                            inclusion=v["inclusion"]
+                        )
+                        for fd in stream_expected_data[self.FIELDS] for k, v in fd.items()
+                    }
+                }
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 simplejson.loads(simplejson.dumps(expected_schemas), use_decimal=True),
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_float.py b/tests/test_sync_full_float.py
new file mode 100644
index 0000000..734c3ed
--- /dev/null
+++ b/tests/test_sync_full_float.py
@@ -0,0 +1,226 @@
+"""
+Test tap discovery
+"""
+from decimal import Decimal
+
+from numpy import float32
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+
+class SyncFloatFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_float_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        values = [
+            (0, 1.1754944e-38, 2.2250738585072014e-308, 1.1754944e-38),
+            (1, 3.4028235e+38, 1.7976931348623157e+308, 3.4028235e+38),
+            (2, -1.1754944e-38, -2.2250738585072014e-308, -1.1754944e-38),
+            (3, -3.4028235e+38, -1.7976931348623157e+308, -3.4028235e+38),
+            (4, 0.0, 0.0, 0.0),
+            (5, None, None, None),
+            (6, 7.830105e-33, 6.46504535047369e-271, 4.0229383e-27),
+            (7, 4.4540307e-21, 7.205251086772512e-202, 7.196247e-19),
+            (8, 647852.6, 2.1597057137884757e+40, 8.430207e+34),
+            (9, 3603.407, 8.811948588549982e+23, 9.1771755e+35),
+            (10, -8.451405e-24, -1.783306877438393e-178, -2.2775854e-31),
+            (11, -5.8271772e-27, -9.344274532947989e-227, -3.5728205e-18),
+            (12, -8.519153e+23, -2.3035944912603858e+241, -5.7120217e+35),
+            (13, -30306750.0, -5.222263032559684e+106, -1.9535917e+27)]
+
+        schema = {
+            'selected': True,
+            'type': 'object',
+            'properties': {
+                'float_24': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'float_53': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'real_24_bits': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'pk': {
+                    'selected': True,
+                    'type': ['integer'],
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'inclusion': 'automatic'}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_float_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'float_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'float_24': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'float_53': {'sql-datatype': 'float', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'real_24_bits': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': schema}}
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "float_precisions"
+        column_name = ["pk", "float_24", "float_53", "real_24_bits"]
+        column_type = ["int", "float(24)", "float(53)", "real"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md,
+            non_selected_properties=["cash_money", "change"])
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            column_index = [list(key.keys())[0] for key in
+                                            self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+
+                            if self.expected_metadata()[stream][self.FIELDS][column_index][column_name][self.DATATYPE] \
+                                    in ("real", "float") \
+                                    and actual_row["data"][column_name] is not None:
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="float value is not represented as a number")
+                                self.assertEqual(float(str(float32(expected_value))),
+                                                 float(str(float32(actual_row["data"][column_name]))),
+                                                 msg="single value of {} doesn't match actual {}".format(
+                                                     float(str(float32(expected_value))),
+                                                     float(str(float32(actual_row["data"][column_name]))))
+                                                 )
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_integers.py b/tests/test_sync_full_integers.py
new file mode 100644
index 0000000..96b4d8c
--- /dev/null
+++ b/tests/test_sync_full_integers.py
@@ -0,0 +1,360 @@
+"""
+Test tap discovery
+"""
+
+from decimal import Decimal
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+
+class SyncIntFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_integer_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775807, 2147483647, 32767),
+                    (3, None, None, None),
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyBigIntColumn': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'MyBigIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 255, True),
+                    (2, None, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyTinyIntColumn': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MyTinyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        table_name = "integers"
+        column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and get the same records
+        # NOTE:  THIS IS ONLY DONE IN THIS TEST.  It also tests we don't send activate version before completion
+        # and the talbe version is incremented
+        # ----------------------------------------------------------------------
+        # TODO - update the table to add a column and ensure that discovery adds the new column
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                # {'action': 'upsert', 'sequence': 1560362044666000001, 'data': {'MySmallIntColumn': 0, 'pk': 1, 'MyIntColumn': 0, 'MyBigIntColumn': 0}}
+
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'upsert')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][0:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][0:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+                self.assertGreater(new_table_version, table_version,
+                                   msg="table version {} didn't increate from {} on the second run".format(
+                                       new_table_version,
+                                       table_version))
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_multiple_dbs.py b/tests/test_sync_full_multiple_dbs.py
new file mode 100644
index 0000000..a7831c2
--- /dev/null
+++ b/tests/test_sync_full_multiple_dbs.py
@@ -0,0 +1,391 @@
+"""
+Test tap discovery
+"""
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, create_schema
+
+from base import BaseTapTest
+
+
+class SyncMultipleFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_multiple_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "database_name"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        fields = [
+            {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+            {'column_name': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}]
+        schema = {
+            'type': 'object',
+            'properties': {
+                'column_name': {
+                    'type': ['integer', 'null'],
+                    'minimum': -2147483648,
+                    'maximum': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                'pk':
+                    {'type': ['integer'],
+                     'minimum': -2147483648,
+                     'maximum': 2147483647,
+                     'inclusion': 'automatic',
+                     'selected': True}},
+            'selected': True}
+
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 1),
+                    (1, 2)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': fields,
+                'schema': schema},
+            }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 5),
+                (1, 6)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 7),
+                (1, 8)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        database_name = "DATABASE_NAME_NO_COLLISION"
+        query_list.extend(create_database(database_name, "Latin1_General_CS_AS"))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 9),
+                (1, 10)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 11),
+                (1, 12)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 13),
+                (1, 14)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 15),
+                (1, 16)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_names.py b/tests/test_sync_full_names.py
new file mode 100644
index 0000000..e5e7e17
--- /dev/null
+++ b/tests/test_sync_full_names.py
@@ -0,0 +1,394 @@
+"""
+Test tap discovery
+"""
+
+from random import randint
+
+import sys
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+LOWER_ALPHAS, UPPER_ALPHAS, DIGITS, OTHERS = [], [], [], []
+for letter in range(97, 123):
+    LOWER_ALPHAS.append(chr(letter))
+
+for letter in range(65, 91):
+    UPPER_ALPHAS.append(chr(letter))
+
+for digit in range(48, 58):
+    DIGITS.append(chr(digit))
+
+for invalid in set().union(range(32, 48), range(58, 65), range(91, 97), range(123, 127)):
+    OTHERS.append(chr(invalid))
+
+ALPHA_NUMERIC = list(set(LOWER_ALPHAS).union(set(UPPER_ALPHAS)).union(set(DIGITS)))
+
+
+class SyncTestNameFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_names_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        # use all valid unicode characters
+        chars = list(range(0, 55296))
+        chars.extend(range(57344, sys.maxunicode))
+        chars.reverse()  # pop starting with ascii characters
+
+        char_values = [(pk, "".join([chr(chars.pop()) for _ in range(2)])) for pk in range(16)]
+        char_name = "invalid_characters_{}".format("".join(OTHERS).replace('"', ""))
+        char_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                char_name: {
+                    'type': ['string', 'null'],
+                    'maxLength': 2,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 2},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648}}}
+
+        varchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(15)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 16))])
+             ) for pk in range(3)
+        ]
+        varchar_name = "1834871389834_start_with_numbers"
+        varchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'varchar_8000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 8000,
+                    'inclusion': 'available',
+                    'selected': True},  # 'minLength': 0},
+                varchar_name: {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                'varchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True}}}
+                # 'minLength': 0}}}
+
+        nchar_values = [
+            (pk,
+             "".join([chr(chars.pop()) for _ in range(4)]))
+            for pk in range(3)
+        ]
+        #  expect that values are right padded with spaces in the db.
+        nchar_values = [(x, "{}{}".format(y, " " * ((16 - len(y.encode('utf-16-le'))) // 2))) for x, y in nchar_values]
+        nchar_name = "SELECT"
+        nchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                nchar_name: {
+                    'type': ['string', 'null'],
+                    'maxLength': 8,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 8},  # length is based on bytes, not characters
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648}}}
+
+        chars.reverse()
+        nvarchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(8)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 8))])
+             ) for pk in range(4)
+        ]
+        nvarchar_name = "hebrew_ישראל"
+        nvarchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'nvarchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'nvarchar_4000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 4000,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                nvarchar_name: {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True}}}
+                # 'minLength': 0}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_{}'.format(char_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': char_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': char_name,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {char_name: {'sql-datatype': 'char', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': char_schema},
+            'data_types_database_dbo_{}'.format(varchar_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': varchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': varchar_name,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {varchar_name: {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_8000': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_max': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': varchar_schema},
+            'data_types_database_dbo_{}'.format(nchar_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': nchar_name,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {nchar_name: {'sql-datatype': 'nchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nchar_schema},
+            'data_types_database_dbo_{}'.format(nvarchar_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nvarchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': nvarchar_name,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {nvarchar_name: {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_4000': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_max': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nvarchar_schema},
+        }
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        table_name = '"{}"'.format(char_name)
+        column_name = ["pk", table_name]  # , "char_8000"]
+        column_type = ["int", "char(2)"]  # , "char(8000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, char_values))
+
+        table_name = "[{}]".format(varchar_name)
+        column_name = ["pk", table_name, "varchar_8000", "varchar_max"]
+        column_type = ["int", "varchar(5)", "varchar(8000)", "varchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, varchar_values))
+
+        table_name = "[{}]".format(nchar_name)
+        column_name = ["pk", "[{}]".format(nchar_name)]
+        column_type = ["int", "nchar(8)"]  # , "nchar(4000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        # strip padding off query data
+        nchar_query_values = [
+            (x, y.rstrip() if isinstance(y, str) else y) for x, y in nchar_values]
+        query_list.extend(insert(database_name, schema_name, table_name, nchar_query_values))
+
+        table_name = nvarchar_name
+        column_name = ["pk", nvarchar_name, "nvarchar_4000", "nvarchar_max"]
+        column_type = ["int", "nvarchar(5)", "nvarchar(4000)", "nvarchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+
+        query_list.extend(insert(database_name, schema_name, table_name, nvarchar_values))
+        query_list.extend(['-- there are {} characters left to test'.format(len(chars))])
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+        mssql_cursor_context_manager(*query_list)
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        self.maxDiff = None
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md,
+            non_selected_properties=["cash_money", "change"])
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if expected_value != actual_row["data"][column_name] \
+                                    and isinstance(expected_value, str) \
+                                    and isinstance(actual_row["data"][column_name], str):
+                                print("diff = {}".format(
+                                    set(expected_value).symmetric_difference(set(actual_row["data"][column_name]))))
+
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="for column {} expected: {} != actual {}".format(
+                                                    column_name,
+                                                    expected_value,
+                                                    actual_row["data"][column_name]))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_others.py b/tests/test_sync_full_others.py
new file mode 100644
index 0000000..155990e
--- /dev/null
+++ b/tests/test_sync_full_others.py
@@ -0,0 +1,340 @@
+"""
+Test tap discovery
+"""
+
+import uuid
+from datetime import datetime
+from decimal import Decimal
+
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+
+class SyncOtherFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_other_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        text_values = [
+            (0, None, None, None),
+            (1, "abc", "def", "ghi".encode('utf-8'))
+        ]
+        text_schema = {
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'rowversion_synonym_timestamp': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']},
+                'varchar_text': {},
+                'nvarchar_text': {},
+                'varbinary_data': {}},
+            'type': 'object'}
+
+        other_values = [
+            (0, None, None, None, str(uuid.uuid1()).upper(), None, None, None)
+        ]
+        other_schema = {
+            'selected': True,
+            'properties': {
+                'markup': {},
+                'variant': {},
+                'geospacial': {},
+                'SpecialPurposeColumns': {},
+                'tree': {},
+                'guid': {
+                    'inclusion': 'available',
+                    'selected': True,
+                    'pattern': '[A-F0-9]{8}-([A-F0-9]{4}-){3}[A-F0-9]{12}',
+                    'type': ['string', 'null']},
+                'geospacial_map': {},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'version': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']}},
+            'type': 'object'}
+
+        comp_values = [
+            (0, datetime(1970, 7, 8, 3), datetime.now())
+        ]
+        comp_schema = {
+            'selected': True,
+            'properties': {
+                'started_at': {
+                    'selected': False,
+                    'type': ['string', 'null'],
+                    'inclusion': 'available',
+                    'format': 'date-time'},
+                'durations_days': {
+                    'inclusion': 'available',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer', 'null'],
+                    'selected': True},
+                'ended_at': {
+                    'format': 'date-time',
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'selected': False},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True}},
+            'type': 'object'}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_text_and_image_deprecated_soon': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': text_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'text_and_image_deprecated_soon',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"nvarchar_text": {'sql-datatype': 'ntext', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"varchar_text": {'sql-datatype': 'text', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"varbinary_data": {'sql-datatype': 'image', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"rowversion_synonym_timestamp": {'sql-datatype': 'timestamp', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': text_schema},
+            'data_types_database_dbo_weirdos': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': other_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'weirdos',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"geospacial": {'sql-datatype': 'geometry', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"geospacial_map": {'sql-datatype': 'geography', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"markup": {'sql-datatype': 'xml', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"guid": {'sql-datatype': 'uniqueidentifier', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {"tree": {'sql-datatype': 'hierarchyid', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"variant": {'sql-datatype': 'sql_variant', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"SpecialPurposeColumns": {'sql-datatype': 'xml', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"version": {'sql-datatype': 'timestamp', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': other_schema},
+            'data_types_database_dbo_computed_columns': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': comp_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'computed_columns',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"started_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                    'inclusion': 'available'}},
+                    {"ended_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                  'inclusion': 'available'}},
+                    {"durations_days": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'unavailable'}}],
+                'schema': comp_schema},
+        }
+
+        # test timestamp and usnupported
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["pk", "nvarchar_text", "varchar_text", "varbinary_data",
+                       "rowversion_synonym_timestamp"]
+        column_type = ["int", "ntext", "text", "image", "timestamp"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, text_values, column_name[:-1]))
+
+        # test uniqueidentifier and rowversion
+        table_name = "weirdos"
+        column_name = [
+            "pk", "geospacial", "geospacial_map", "markup", "guid", "tree",
+            "variant", "SpecialPurposeColumns", "version"
+        ]
+        column_type = [
+            "int", "geometry", "geography", "xml", "uniqueidentifier", "hierarchyid",
+            "sql_variant", "xml COLUMN_SET FOR ALL_SPARSE_COLUMNS", "rowversion"
+        ]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, other_values, column_name[:-1]))
+
+        table_name = "computed_columns"
+        column_name = ["pk", "started_at", "ended_at", "durations_days"]
+        column_type = ["int", "datetimeoffset", "datetimeoffset", "AS DATEDIFF(day, started_at, ended_at)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, comp_values, column_name[:-1]))
+        mssql_cursor_context_manager(*query_list)
+
+        # update values with rowversions
+        rows = mssql_cursor_context_manager(*["select version from data_types_database.dbo.weirdos order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_weirdos']['values'] = \
+            [other_values[row] + (version, ) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(*["select rowversion_synonym_timestamp from data_types_database.dbo.text_and_image_deprecated_soon order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_text_and_image_deprecated_soon']['values'] = \
+            [text_values[row] + (version, ) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(*["select durations_days from data_types_database.dbo.computed_columns order by pk"])
+        cls.EXPECTED_METADATA['data_types_database_dbo_computed_columns']['values'] = \
+            [comp_values[row] + tuple(version) for row, version in enumerate(rows)]
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        found_catalog_names = {c['tap_stream_id'] for c in found_catalogs}
+
+        # verify that persisted streams have the correct properties
+        test_catalog = found_catalogs[0]
+
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+
+        # Don't select unsupported data types
+        non_selected_properties = ["nvarchar_text", "varchar_text", "varbinary_data",
+                                   "geospacial", "geospacial_map", "markup", "tree",
+                                   "variant", "SpecialPurposeColumns", "started_at", "ended_at"]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md,
+            non_selected_properties=non_selected_properties)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                            if column not in non_selected_properties
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_pks.py b/tests/test_sync_full_pks.py
new file mode 100644
index 0000000..e762276
--- /dev/null
+++ b/tests/test_sync_full_pks.py
@@ -0,0 +1,587 @@
+"""
+Test tap discovery
+"""
+
+from decimal import Decimal
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, create_view
+
+from base import BaseTapTest
+
+
+class SyncIntFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_pk_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        # query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "no_constraints"
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [(0, ), (1, )],
+                'table-key-properties': set(),
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': [
+                    {'column_name': {'sql-datatype': 'int', 'selected-by-default': True,
+                                     'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'column_name': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            }
+
+        column_name = ["column_name"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "multiple_column_pk"
+        primary_key = ["first_name", "last_name"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                ("Tim", "Berners-Lee", 64),
+                ("Sergey", "Brin", 45),
+                ("Larry", "Page", 46)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                    {'first_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'last_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'info': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'info': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'first_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True},  # , 'minLength': 0},
+                    'last_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True}}}  # 'minLength': 0}}}
+        }
+        column_name = ["first_name", "last_name", "info"]
+        column_type = ["varchar(256)", "varchar(256)", "int"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "single_column_pk"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "data"]
+        column_type = ["int", "int"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_unique_not_null"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "data"]
+        column_type = ["int", "int NOT NULL UNIQUE"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_fk"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 1),
+                (1, 0),
+                (2, 0),
+                (3, 1),
+                (4, None)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'fk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'fk': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "fk"]
+        column_type = ["int", "int"]
+        foreign_key = "fk"
+        reference = "{}.pk_with_unique_not_null(pk)".format(schema_name)
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def,
+            primary_key=primary_key, foreign_key=foreign_key, reference=reference))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "view_with_join"
+        primary_key = []
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': True,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (1, 4, 0),
+                (0, 3, 1),
+                (0, 3, 2),
+                (1, 4, 3),
+                (None, None, 4)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'column1': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                {'column2': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'column1': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'column2': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        select = ("SELECT p.pk as column1, data, f.pk as column2 "
+                  "FROM pk_with_unique_not_null p "
+                  "RIGHT JOIN pk_with_fk f on p.pk = f.fk")
+        query_list.extend(create_view(schema_name, table_name, select))
+
+        table_name = "table_with_index"
+        primary_key = []
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'not_pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'not_pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["not_pk", "data"]
+        column_type = ["int", "int NOT NULL INDEX myindex"]
+
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "default_column"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, ),
+                (1, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'default_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'default_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "default_column"]
+        column_type = ["int", "int DEFAULT -1"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+                (0, -1),
+                (1, -1)]
+
+        table_name = "check_constraint"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 120),
+                (1, 34)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'age': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'age': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "age"]
+        column_type = ["int", "int CHECK (age <= 120)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "even_identity"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (1, ),
+                (2, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'even_id': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'even_id': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "even_id"]
+        column_type = ["int", "int IDENTITY(2,2)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+            (1, 2),
+            (2, 4)]
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_full_strings.py b/tests/test_sync_full_strings.py
new file mode 100644
index 0000000..bc56e96
--- /dev/null
+++ b/tests/test_sync_full_strings.py
@@ -0,0 +1,394 @@
+"""
+Test tap discovery
+"""
+
+from random import randint
+
+import sys
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert
+
+from base import BaseTapTest
+
+
+class SyncTestStringFull(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_full_sync_strings_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        # use all valid unicode characters
+        chars = list(range(0, 55296))
+        chars.extend(range(57344, 65534))  # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1217
+        chars.extend(range(65535, sys.maxunicode))
+        chars.reverse()  # pop starting with ascii characters
+
+        char_values = [(pk, "".join([chr(chars.pop()) for _ in range(2)])) for pk in range(16)]
+        char_values.extend([(16, None), ])
+        char_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'char_2': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 2},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648}}}
+
+        varchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(15)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 16))])
+             ) for pk in range(3)
+        ]
+        varchar_values.extend([(3, None, None, None), ])
+        varchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'varchar_8000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 8000,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 0},
+                'varchar_5': {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 0},
+                'varchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True}}}
+                    # 'minLength': 0}}}
+
+        chars.reverse()
+        nchar_values = [
+            (pk,
+             "".join([chr(chars.pop()) for _ in range(4)]))
+            for pk in range(3)
+        ]
+        #  expect that values are right padded with spaces in the db.
+        nchar_values = [(x, "{}{}".format(y, " " * ((16 - len(y.encode('utf-16-le'))) // 2))) for x, y in nchar_values]
+        nchar_values.extend([(3, None), ])
+        nchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'nchar_8': {
+                    'type': ['string', 'null'],
+                    'maxLength': 8,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 8},  # length is based on bytes, not characters
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648}}}
+
+        nvarchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(8)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 8))])
+             ) for pk in range(50)
+        ]
+        nvarchar_values.extend([(50, None, None, None), ])
+
+        pk = 51
+        while len(chars):
+            #  Use the rest of the characters
+            nvarchar_values.extend([(
+                pk,
+                chr(chars.pop()),
+                "".join([chr(chars.pop()) for _ in range(min(len(chars), 800))]) if len(chars) else "",
+                "".join([chr(chars.pop()) for _ in range(min(len(chars), randint(1, 800)))]) if len(chars) else ""
+            )])
+            pk += 1
+
+        nvarchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'nvarchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 0},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'nvarchar_4000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 4000,
+                    'inclusion': 'available',
+                    'selected': True},
+                    # 'minLength': 0},
+                'nvarchar_5': {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True}}}
+                    # 'minLength': 0}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_char_data': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': char_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'char_data',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'char_2': {'sql-datatype': 'char', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': char_schema},
+            'data_types_database_dbo_varchar_data': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': varchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'varchar_data',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'varchar_5': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_8000': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_max': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': varchar_schema},
+            'data_types_database_dbo_nchar_data': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'nchar_data',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'nchar_8': {'sql-datatype': 'nchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nchar_schema},
+            'data_types_database_dbo_nvarchar_data': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nvarchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'nvarchar_data',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'nvarchar_5': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_4000': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_max': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nvarchar_schema},
+        }
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+
+        table_name = "char_data"
+        column_name = ["pk", "char_2"]  # , "char_8000"]
+        column_type = ["int", "char(2)"]  # , "char(8000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, char_values))
+
+        table_name = "varchar_data"
+        column_name = ["pk", "varchar_5", "varchar_8000", "varchar_max"]
+        column_type = ["int", "varchar(5)", "varchar(8000)", "varchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name, varchar_values))
+
+        table_name = "nchar_data"
+        column_name = ["pk", "nchar_8"]  # , "nchar_4000"]
+        column_type = ["int", "nchar(8)"]  # , "nchar(4000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        # strip padding off query data
+        nchar_query_values = [
+            (x, y.rstrip() if isinstance(y, str) else y) for x, y in nchar_values]
+        query_list.extend(insert(database_name, schema_name, table_name, nchar_query_values))
+
+        table_name = "nvarchar_data"
+        column_name = ["pk", "nvarchar_5", "nvarchar_4000", "nvarchar_max"]
+        column_type = ["int", "nvarchar(5)", "nvarchar(4000)", "nvarchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+
+        query_list.extend(insert(database_name, schema_name, table_name, nvarchar_values))
+        query_list.extend(['-- there are {} characters left to test'.format(len(chars))])
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+        mssql_cursor_context_manager(*query_list)
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        self.maxDiff = None
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'FULL_TABLE'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md,
+            non_selected_properties=["cash_money", "change"])
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                # TODO - test schema matches expectations based on data type, nullable, not nullable, datetimes as string +, etc
+                #   This needs to be consistent based on replication method so you can change replication methods
+                table_version = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get activate version message before and after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if expected_value != actual_row["data"][column_name] \
+                                    and isinstance(expected_value, str) \
+                                    and isinstance(actual_row["data"][column_name], str):
+                                print("diff = {}".format(
+                                    set(expected_value).symmetric_difference(set(actual_row["data"][column_name]))))
+
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="for column {} expected: {} != actual {}".format(
+                                                    column_name,
+                                                    expected_value,
+                                                    actual_row["data"][column_name]))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                # TODO - change this to something for mssql once binlog (cdc) is finalized and we know what it is
+                self.assertIsNone(
+                    bookmark.get('lsn'),
+                    msg="expected bookmark for stream to have NO lsn because we are using full-table replication")
+
+                self.assertEqual(bookmark['version'], table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_datetime.py b/tests/test_sync_incremental_datetime.py
new file mode 100644
index 0000000..f9649c4
--- /dev/null
+++ b/tests/test_sync_incremental_datetime.py
@@ -0,0 +1,537 @@
+"""
+Test tap discovery
+"""
+from datetime import date, datetime, timezone, time, timedelta
+from time import strptime
+
+from dateutil.tz import tzoffset
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncDateIncremental(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_date_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).isoformat(),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 29),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492000, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110000, tzinfo=timezone(timedelta(hours=10, minutes=5))).isoformat(),
+                datetime(2031, 4, 30, 19, 32, 0, 0, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102000, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546000, tzinfo=timezone(timedelta(hours=6, minutes=15))).isoformat(),
+                datetime(2024, 6, 22, 0, 36, 0, 0, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+
+        schema = {
+            'selected': True,
+            'properties': {
+                'its_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null']},
+                'pk': {
+                    'maximum': 2147483647,
+                    'selected': True,
+                    'inclusion': 'automatic',
+                    'type': ['integer'],
+                    'minimum': -2147483648},
+                'replication_key_column': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                'date_and_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "bigger_range_and_precision_datetime": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_with_timezones": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_no_seconds": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'}},
+            'type': 'object'}
+
+        fields = [
+            {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+            {'replication_key_column': {'sql-datatype': 'date', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'date_and_time': {'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'bigger_range_and_precision_datetime': {'sql-datatype': 'datetime2', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_with_timezones': {'sql-datatype': 'datetimeoffest', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_no_seconds': {'sql-datatype': 'smalldatetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'its_time': {'sql-datatype': 'time', 'selected-by-default': True, 'inclusion': 'available'}}]
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "dates_and_times"
+        primary_key = {"pk"}
+
+        column_name = ["pk", "replication_key_column", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        column_type = ["int", "date", "datetime", "datetime2", "datetimeoffset", "smalldatetime", "time"]
+
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, values))
+
+        mssql_cursor_context_manager(*query_list)
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).astimezone(timezone.utc),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 29),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492000, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110000, tzinfo=timezone(timedelta(hours=10, minutes=5))).astimezone(timezone.utc),
+                datetime(2031, 4, 30, 19, 32, 0, 0, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102000, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546000, tzinfo=timezone(timedelta(hours=6, minutes=15))).astimezone(timezone.utc),
+                datetime(2024, 6, 22, 0, 36, 0, 0, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': primary_key,
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': fields,
+                'schema': schema}
+        }
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'replication_key_column'}}]
+
+        BaseTapTest.select_all_streams_and_fields(conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        non_selected_properties = []
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, time):
+                                # sql server time has second resolution only
+                                self.assertEqual(
+                                    expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, date):
+                                # sql server time has second resolution only
+                                self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat() + 'T00:00:00+00:00',
+                                                     actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value, actual_row["data"][column_name]))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                expected_bookmark = max([row[1] for row in stream_expected_data[self.VALUES] if row[1] is not None])
+                self.assertEqual(bookmark['replication_key_value'],
+                                 expected_bookmark.isoformat())
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "dates_and_times"
+        column_name = ["pk", "replication_key_column", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        insert_value = [
+            (
+                5,
+                date(9999, 12, 30),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (
+                6,
+                date(2018, 12, 29),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc))]
+        update_value = [(
+                3,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=10))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (
+                4,
+                date(2018, 12, 30),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=6))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc))]
+        delete_value = [(2, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+
+        insert_value = [
+            (
+                5,
+                date(9999, 12, 30),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (
+                6,
+                date(2018, 12, 29),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc))]
+        update_value = [(
+                3,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=10))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (
+                4,
+                date(2018, 12, 30),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=6))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc))]
+
+        insert_value = insert_value[:-1]  # only repl_key >= gets included
+        update_value = update_value[:-1]
+        self.EXPECTED_METADATA["data_types_database_dbo_dates_and_times"]["values"] = [
+              (
+                  1,
+                  date(9999, 12, 29),
+                  datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                  datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                  datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                  datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                  time(23, 59, 59, tzinfo=timezone.utc))
+            ] + update_value + insert_value
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, time):
+                                # sql server time has second resolution only
+                                self.assertEqual(
+                                    expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, date):
+                                # sql server time has second resolution only
+                                self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat() + 'T00:00:00+00:00',
+                                                     actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value, actual_row["data"][column_name]))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                expected_bookmark = max([row[1] for row in stream_expected_data[self.VALUES] if row[1] is not None])
+                self.assertEqual(bookmark['replication_key_value'],
+                                 expected_bookmark.isoformat())
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_decimal.py b/tests/test_sync_incremental_decimal.py
new file mode 100644
index 0000000..aab829d
--- /dev/null
+++ b/tests/test_sync_incremental_decimal.py
@@ -0,0 +1,518 @@
+"""
+Test tap discovery
+"""
+from decimal import getcontext, Decimal
+
+import simplejson
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+getcontext().prec = 38
+DECIMAL_PRECISION_SCALE = [(9, 4), (19, 6), (28, 6), (38, 13)]
+NUMERIC_PRECISION_SCALE = [(9, 4), (19, 12), (28, 22), (38, 3)]
+
+
+class SyncDecimalIncremental(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_decimal_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        numeric_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999.999999999999'), Decimal('-999999.9999999999999999999999'), Decimal('-99999999999999999999999999999999999.999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9993'), Decimal('9999999.999999999999'), Decimal('999999.9999999999999999999999'), Decimal('99999999999999999999999999999999999.993')),
+            (4, Decimal('96701.9382'), Decimal('-4371716.186100650268'), Decimal('-367352.306093776232045517794'), Decimal('-81147872128956247517327931319278572.985')),
+            (5, Decimal('-73621.9366'), Decimal('2564047.277589545531'), Decimal('336177.4754683699464233786667'), Decimal('46946462608534127558389411015159825.758')),
+            (6, Decimal('-3070.7339'), Decimal('6260062.158440967433'), Decimal('-987006.0035971607740533206418'), Decimal('95478671259010046866787754969592794.61'))]
+
+        numeric_schema = {
+            'type': 'object',
+            'properties': {
+                'numeric_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'numeric_19_12': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-12,
+                    'maximum': 1e7,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e7},
+                'numeric_28_22': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-22,
+                    'maximum': 1e6,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e6},
+                'replication_key_column': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': .001,
+                    'maximum': 1e35,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e35},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True}},
+            'selected': True}
+
+        decimal_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999999999.999999'), Decimal('-9999999999999999999999.999999'), Decimal('-9999999999999999999999999.9999999999999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9993'), Decimal('9999999999999.999999'), Decimal('9999999999999999999999.999999'), Decimal('9999999999999999999999999.9999999999993')),
+            (4, Decimal('-92473.8401'), Decimal('-4182159664734.645653'), Decimal('6101329656084900380190.268036'), Decimal('4778017533841887320066645.9761464001349')),
+            (5, Decimal('-57970.8157'), Decimal('7735958802279.086687'), Decimal('4848737828398517845540.057905'), Decimal('2176036096567853905237453.5152648989022')),
+            (6, Decimal('57573.9037'), Decimal('5948502499261.181557'), Decimal('-6687721783088280707003.076638'), Decimal('-6264019242578746090842245.3746225058202'))]
+
+        decimal_schema = {
+            'type': 'object',
+            'properties': {
+                'decimal_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'decimal_19_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e13,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e13},
+                'decimal_28_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e22,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e22},
+                'replication_key_column': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-13,
+                    'maximum': 1e25,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e25},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True}},
+            'selected': True}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_numeric_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': numeric_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'numeric_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'numeric_9_4': {'sql-datatype': 'numeric(9,4)', 'selected-by-default': True,
+                                                'inclusion': 'available'}},
+                    {'numeric_19_12': {'sql-datatype': 'numeric(19,12)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'numeric_28_22': {'sql-datatype': 'numeric(28,22)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'replication_key_column': {'sql-datatype': 'numeric(38,3)', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': numeric_schema},
+            'data_types_database_dbo_decimal_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': decimal_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'decimal_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'decimal_9_4': {'sql-datatype': 'decimal(9,4)', 'selected-by-default': True,
+                                                'inclusion': 'available'}},
+                    {'decimal_19_6': {'sql-datatype': 'decimal(19,6)', 'selected-by-default': True,
+                                      'inclusion': 'available'}},
+                    {'decimal_28_6': {'sql-datatype': 'decimal(28,6)', 'selected-by-default': True,
+                                       'inclusion': 'available'}},
+                    {'replication_key_column': {'sql-datatype': 'decimal(38,13)', 'selected-by-default': True,
+                                      'inclusion': 'available'}}],
+                'schema': decimal_schema}}
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1075
+        table_name = "numeric_precisions"
+        precision_scale = NUMERIC_PRECISION_SCALE
+        column_type = [
+            "numeric({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "")
+                                for x in column_type[:-1]] + ["replication_key_column"]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["values"]))
+
+        table_name = "decimal_precisions"
+        precision_scale = DECIMAL_PRECISION_SCALE
+        column_type = [
+            "decimal({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "")
+                                for x in column_type[:-1]] + ["replication_key_column"]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'replication_key_column'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(stream_expected_data[self.VALUES]),
+                                 len(records_by_stream[stream]['messages'][1:-1]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[-1] is not None, row[-1]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, Decimal):
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="decimal value is not represented as a number")
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                expected_bookmark = max([row[-1] for row in stream_expected_data[self.VALUES] if row[-1] is not None])
+                # currently decimal replication keys aren't supported in the front end.  If they are at a later point
+                # this should be a decimal comparison. https://stitchdata.atlassian.net/browse/SRCE-1331
+                self.assertEqual(bookmark['replication_key_value'], float(expected_bookmark))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 simplejson.loads(simplejson.dumps(expected_schemas), use_decimal=True),
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "numeric_precisions"
+        precision_scale = NUMERIC_PRECISION_SCALE
+        column_type = [
+            "numeric({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "")
+                                for x in column_type[:-1]] + ["replication_key_column"]
+        insert_value = [(8, Decimal(100), Decimal(100), Decimal(100), Decimal(100)),
+                        (7,
+                         Decimal('99999.9995'),
+                         Decimal('9999999.999999999999'),
+                         Decimal('999999.9999999999999999999999'),
+                         Decimal('99999999999999999999999999999999999.995'))]
+        update_value = [(5, Decimal(100), Decimal(100), Decimal(100), Decimal(100)),
+                        (6,
+                         Decimal('99999.9999'),
+                         Decimal('9999999.999999999999'),
+                         Decimal('999999.9999999999999999999999'),
+                         Decimal('99999999999999999999999999999999999.999'))]
+        delete_value = [(4, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = insert_value[-1:]  # only repl_key >= gets included
+        update_value = update_value[-1:]
+        self.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["values"] = [
+                (3,
+                 Decimal('99999.9993'),
+                 Decimal('9999999.999999999999'),
+                 Decimal('999999.9999999999999999999999'),
+                 Decimal('99999999999999999999999999999999999.993')),
+            ] + update_value + insert_value
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "decimal_precisions"
+        precision_scale = DECIMAL_PRECISION_SCALE
+        column_type = [
+            "decimal({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "")
+                                for x in column_type[:-1]] + ["replication_key_column"]
+        insert_value = [(8, Decimal(100), Decimal(100), Decimal(100), Decimal(100)),
+                        (7,
+                         Decimal('99999.9995'),
+                         Decimal('9999999999999.999999'),
+                         Decimal('9999999999999999999999.999999'),
+                         Decimal('9999999999999999999999999.9999999999995'))]
+        update_value = [(5, Decimal(100), Decimal(100), Decimal(100), Decimal(100)),
+                        (6,
+                         Decimal('99999.9999'),
+                         Decimal('9999999999999.999999'),
+                         Decimal('9999999999999999999999.999999'),
+                         Decimal('9999999999999999999999999.9999999999999'))]
+        delete_value = [(4,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = insert_value[-1:]  # only repl_key >= gets included
+        update_value = update_value[-1:]
+        self.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["values"] = [
+                (3,
+                 Decimal('99999.9993'),
+                 Decimal('9999999999999.999999'),
+                 Decimal('9999999999999999999999.999999'),
+                 Decimal('9999999999999999999999999.9999999999993'))] + update_value + insert_value
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[-1] is not None, row[-1]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, Decimal):
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="decimal value is not represented as a number")
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                expected_bookmark = max([row[-1] for row in stream_expected_data[self.VALUES] if row[-1] is not None])
+                # currently decimal replication keys aren't supported in the front end.  If they are at a later point
+                # this should be a decimal comparison. https://stitchdata.atlassian.net/browse/SRCE-1331
+                self.assertEqual(bookmark['replication_key_value'], float(expected_bookmark))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 simplejson.loads(simplejson.dumps(expected_schemas), use_decimal=True),
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_float.py b/tests/test_sync_incremental_float.py
new file mode 100644
index 0000000..ae15657
--- /dev/null
+++ b/tests/test_sync_incremental_float.py
@@ -0,0 +1,353 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+from decimal import Decimal
+
+from numpy.core import float32
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncFloatIncremental(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_float_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        values = [
+            (0, 1.1754944e-38, 2.2250738585072014e-308, 1.1754944e-38),
+            (1, 3.4028230e+38, 1.7976931348623157e+308, 3.4028235e+38),
+            (2, -1.1754944e-38, -2.2250738585072014e-308, -1.1754944e-38),
+            (3, -3.4028235e+38, -1.7976931348623157e+308, -3.4028235e+38),
+            (4, 0.0, 0.0, 0.0),
+            (5, None, None, None),
+            (6, 7.830105e-33, 6.46504535047369e-271, 4.0229383e-27),
+            (7, 4.4540307e-21, 7.205251086772512e-202, 7.196247e-19),
+            (8, 647852.6, 2.1597057137884757e+40, 8.430207e+34),
+            (9, 3603.407, 8.811948588549982e+23, 9.1771755e+35),
+            (10, -8.451405e-24, -1.783306877438393e-178, -2.2775854e-31),
+            (11, -5.8271772e-27, -9.344274532947989e-227, -3.5728205e-18),
+            (12, -8.519153e+23, -2.3035944912603858e+241, -5.7120217e+35),
+            (13, -30306750.0, -5.222263032559684e+106, -1.9535917e+27)]
+
+        schema = {
+            'selected': True,
+            'type': 'object',
+            'properties': {
+                'replication_key_column': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'float_53': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'real_24_bits': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'pk': {
+                    'selected': True,
+                    'type': ['integer'],
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'inclusion': 'automatic'}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_float_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'float_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'float_53': {'sql-datatype': 'float', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'real_24_bits': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': schema}}
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "float_precisions"
+        column_name = ["pk", "replication_key_column", "float_53", "real_24_bits"]
+        column_type = ["int", "float(24)", "float(53)", "real"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'replication_key_column'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(stream_expected_data[self.VALUES]),
+                                 len(records_by_stream[stream]['messages'][1:-1]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            column_index = [list(key.keys())[0] for key in
+                                            self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+                            if self.expected_metadata()[stream][self.FIELDS][column_index][column_name][self.DATATYPE] \
+                                    in ("real", "float") \
+                                    and actual_row["data"][column_name] is not None:
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="float value is not represented as a number")
+                                self.assertEqual(float(str(float32(expected_value))),
+                                                 float(str(float32(actual_row["data"][column_name]))),
+                                                 msg="single value of {} doesn't match actual {}".format(
+                                                     float(str(float32(expected_value))),
+                                                     float(str(float32(actual_row["data"][column_name]))))
+                                                 )
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[1] for row in stream_expected_data[self.VALUES] if row[1] is not None]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "float_precisions"
+        column_name = ["pk", "replication_key_column", "float_53", "real_24_bits"]
+        insert_value = [(15, 100, 100, 100), (14, 3.4028235e+38, 1.7976931348623157e+308, 3.4028235e+38)]
+        update_value = [(4, 101, 101, 101), (6, 3.4028233e+38, 1.7976931348623157e+308, 3.4028235e+38)]
+        delete_value = [(5, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = insert_value[-1:]  # only repl_key >= gets included
+        update_value = update_value[-1:]
+        self.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["values"] = \
+            [(1, 3.4028230e+38, 1.7976931348623157e+308, 3.4028235e+38)] + update_value + insert_value
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            column_index = [list(key.keys())[0] for key in
+                                            self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+                            if self.expected_metadata()[stream][self.FIELDS][column_index][column_name][self.DATATYPE] \
+                                    in ("real", "float") \
+                                    and actual_row["data"][column_name] is not None:
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="float value is not represented as a number")
+                                self.assertEqual(float(str(float32(expected_value))),
+                                                 float(str(float32(actual_row["data"][column_name]))),
+                                                 msg="single value of {} doesn't match actual {}".format(
+                                                     float(str(float32(expected_value))),
+                                                     float(str(float32(actual_row["data"][column_name]))))
+                                                 )
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[1] for row in stream_expected_data[self.VALUES] if row[1] is not None]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_integers.py b/tests/test_sync_incremental_integers.py
new file mode 100644
index 0000000..8f9af2d
--- /dev/null
+++ b/tests/test_sync_incremental_integers.py
@@ -0,0 +1,399 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncIntIncremental(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_integer_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775805, 2147483647, 32767),
+                    (3, None, None, None),
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'replication_key_column': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 253, True),
+                    (2, None, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'replication_key_column': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "integers"
+        column_name = ["pk", "replication_key_column", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "replication_key_column", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'replication_key_column'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(stream_expected_data[self.VALUES]),
+                                 len(records_by_stream[stream]['messages'][1:-1]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[1] for row in stream_expected_data[self.VALUES] if row[1] is not None]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "integers"
+        column_name = ["pk", "replication_key_column", "MyIntColumn", "MySmallIntColumn"]
+        insert_value = [(14, 100, 100, 100), (15, 9223372036854775806, 100, 100)]
+        update_value = [(1, 101, 101, 101), (3, 9223372036854775807, 101, 101)]
+        delete_value = [(5, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [(15, 9223372036854775806, 100, 100)]  # only repl_key >= gets included
+        update_value = [(3, 9223372036854775807, 101, 101)]
+        self.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"] = \
+            [(2, 9223372036854775805, 2147483647, 32767)] + insert_value + update_value
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "replication_key_column", "my_boolean"]
+        insert_value = [(14, 100, False), (15, 255, True)]
+        update_value = [(3, 101, True), (2, 254, True)]
+        delete_value = [(5,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [(15, 255, True)]
+        update_value = [(2, 254, True)]
+        self.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"] = \
+            [(1, 253, True)] + update_value + insert_value
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[1] for row in stream_expected_data[self.VALUES]]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_others.py b/tests/test_sync_incremental_others.py
new file mode 100644
index 0000000..f23a895
--- /dev/null
+++ b/tests/test_sync_incremental_others.py
@@ -0,0 +1,572 @@
+"""
+Test tap discovery
+"""
+import re
+import uuid
+from datetime import datetime, timezone
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncOtherIncremental(BaseTapTest):
+    """
+     Test the tap discovery
+     NOTE - THIS TEST DOESN'T USE ROVVERSION FOR THE REPLICATION KEY AS IT IS CURRENTLY NOT SUPPORTED
+     ONCE SUPPORTED THIS TEST SHOULD BE CHANGED TO USE ROWVERSION.
+    """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_other_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        text_values = [
+            (0, datetime(2018, 12, 31, 23, 59, 59, 977000, tzinfo=timezone.utc), None, None, None),
+            (1, datetime(2018, 12, 31, 23, 59, 59, 987000, tzinfo=timezone.utc), "abc", "def", "ghi".encode('utf-8'))
+        ]
+        text_schema = {
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'replication_key_column': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']},
+                'temp_replication_key_column': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                'varchar_text': {},
+                'nvarchar_text': {},
+                'varbinary_data': {}},
+            'type': 'object'}
+
+        other_values = [
+            (0, datetime(9999, 12, 31, 23, 59, 59, 977000, tzinfo=timezone.utc),
+             None, None, None, "827376B0-AEF4-11E9-8002-0800276BC1DF", None, None, None),
+            (1, datetime(9999, 12, 31, 23, 59, 59, 987000, tzinfo=timezone.utc),
+             None, None, None, "ACC9A986-AEF4-11E9-8002-0800276BC1DF", None, None, None),
+            (2, datetime(9999, 12, 31, 23, 59, 59, 990000, tzinfo=timezone.utc),
+             None, None, None, "B792681C-AEF4-11E9-8002-0800276BC1DF", None, None, None)
+        ]
+        other_schema = {
+            'selected': True,
+            'properties': {
+                'markup': {},
+                'variant': {},
+                'geospacial': {},
+                'SpecialPurposeColumns': {},
+                'tree': {},
+                'guid': {
+                    'inclusion': 'available',
+                    'selected': True,
+                    'pattern': '[A-F0-9]{8}-([A-F0-9]{4}-){3}[A-F0-9]{12}',
+                    'type': ['string', 'null']},
+                'geospacial_map': {},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'replication_key_column': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']},
+                'temp_replication_key_column': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'}},
+            'type': 'object'}
+
+        comp_values = [
+            (0, datetime(9998, 12, 31, 23, 59, 59, 977000, tzinfo=timezone.utc),
+             datetime(1970, 7, 8, 3), datetime.now()),
+            (1, datetime(9998, 12, 31, 23, 59, 59, 987000, tzinfo=timezone.utc),
+             datetime(1970, 1, 1, 0), datetime.now())
+        ]
+        comp_schema = {
+            'selected': True,
+            'properties': {
+                'started_at': {
+                    'selected': False,
+                    'type': ['string', 'null'],
+                    'inclusion': 'available',
+                    'format': 'date-time'},
+                'replication_key_column': {
+                    'inclusion': 'available',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer', 'null'],
+                    'selected': True},
+                'ended_at': {
+                    'format': 'date-time',
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'selected': False},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'temp_replication_key_column': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'}},
+            'type': 'object'}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_text_and_image_deprecated_soon': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': text_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'text_and_image_deprecated_soon',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'temp_replication_key_column': {'sql-datatype': 'date-time', 'selected-by-default': True,
+                                                     'inclusion': 'available'}},
+                    {"nvarchar_text": {'sql-datatype': 'ntext', 'selected-by-default': False,
+                                       'inclusion': 'unavailable'}},
+                    {"varchar_text": {'sql-datatype': 'text', 'selected-by-default': False,
+                                      'inclusion': 'unavailable'}},
+                    {"varbinary_data": {'sql-datatype': 'image', 'selected-by-default': False,
+                                        'inclusion': 'unavailable'}},
+                    {"replication_key_column": {'sql-datatype': 'timestamp', 'selected-by-default': True,
+                                                'inclusion': 'available'}}],
+                'schema': text_schema},
+            'data_types_database_dbo_weirdos': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': other_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'weirdos',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'temp_replication_key_column': {'sql-datatype': 'date-time', 'selected-by-default': True,
+                                                     'inclusion': 'available'}},
+                    {"geospacial": {'sql-datatype': 'geometry', 'selected-by-default': False,
+                                    'inclusion': 'unavailable'}},
+                    {"geospacial_map": {'sql-datatype': 'geography', 'selected-by-default': False,
+                                        'inclusion': 'unavailable'}},
+                    {"markup": {'sql-datatype': 'xml', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"guid": {'sql-datatype': 'uniqueidentifier', 'selected-by-default': True,
+                              'inclusion': 'available'}},
+                    {"tree": {'sql-datatype': 'hierarchyid', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"variant": {'sql-datatype': 'sql_variant', 'selected-by-default': False,
+                                 'inclusion': 'unavailable'}},
+                    {"SpecialPurposeColumns": {'sql-datatype': 'xml', 'selected-by-default': False,
+                                               'inclusion': 'unavailable'}},
+                    {"replication_key_column": {'sql-datatype': 'timestamp', 'selected-by-default': True,
+                                                'inclusion': 'available'}}],
+                'schema': other_schema},
+            'data_types_database_dbo_computed_columns': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': comp_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'computed_columns',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'temp_replication_key_column': {'sql-datatype': 'date-time', 'selected-by-default': True,
+                                                     'inclusion': 'available'}},
+                    {"started_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                    'inclusion': 'available'}},
+                    {"ended_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                  'inclusion': 'available'}},
+                    {"replication_key_column": {'sql-datatype': 'int', 'selected-by-default': True,
+                                                'inclusion': 'unavailable'}}],
+                'schema': comp_schema},
+        }
+
+        # test timestamp and usnupported
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["pk", "temp_replication_key_column", "nvarchar_text", "varchar_text", "varbinary_data",
+                       "replication_key_column"]
+        column_type = ["int", "datetime", "ntext", "text", "image", "timestamp"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, text_values, column_name[:-1]))
+
+        # test uniqueidentifier and rowversion
+        table_name = "weirdos"
+        column_name = [
+            "pk", "temp_replication_key_column", "geospacial", "geospacial_map", "markup", "guid", "tree",
+            "variant", "SpecialPurposeColumns", "replication_key_column"
+        ]
+        column_type = [
+            "int", "datetime", "geometry", "geography", "xml", "uniqueidentifier", "hierarchyid",
+            "sql_variant", "xml COLUMN_SET FOR ALL_SPARSE_COLUMNS", "rowversion"
+        ]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        # not sure why I have to do this but getting error - Parameter information is missing from a user-defined type.
+        for value in other_values:
+            query_list.extend(insert(database_name, schema_name, table_name, [value], column_name[:-1]))
+
+        table_name = "computed_columns"
+        column_name = ["pk", "temp_replication_key_column", "started_at", "ended_at", "replication_key_column"]
+        column_type = ["int", "datetime", "datetimeoffset", "datetimeoffset", "AS DATEDIFF(day, started_at, ended_at)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, comp_values, column_name[:-1]))
+        mssql_cursor_context_manager(*query_list)
+
+        # update values with rowversions
+        rows = mssql_cursor_context_manager(*[
+            "select replication_key_column from data_types_database.dbo.weirdos order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_weirdos']['values'] = \
+            [other_values[row] + (version,) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(*[
+            "select replication_key_column from data_types_database.dbo.text_and_image_deprecated_soon order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_text_and_image_deprecated_soon']['values'] = \
+            [text_values[row] + (version,) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(
+            *["select replication_key_column from data_types_database.dbo.computed_columns order by pk"])
+        cls.EXPECTED_METADATA['data_types_database_dbo_computed_columns']['values'] = \
+            [comp_values[row] + tuple(version) for row, version in enumerate(rows)]
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        # TODO - change the replication key back to replication_key_column when rowversion is supported
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'temp_replication_key_column'}}]
+
+        non_selected_properties = ["nvarchar_text", "varchar_text", "varbinary_data",
+                                   "geospacial", "geospacial_map", "markup", "tree",
+                                   "variant", "SpecialPurposeColumns", "started_at", "ended_at"]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, non_selected_properties=non_selected_properties, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }  # TODO - change to -1 for using rowversion for replication key
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in zip(expected_messages, records_by_stream[stream]['messages'][1:-1]):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key TODO - change to -1 for using rowversion for replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 re.sub(
+                                     r'\d{3}Z',
+                                     "Z",
+                                     max([row[1] for row in stream_expected_data[self.VALUES]])
+                                         .strftime("%Y-%m-%dT%H:%M:%S.%fZ")))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["pk", "temp_replication_key_column", "nvarchar_text", "varchar_text", "varbinary_data",
+                       "replication_key_column"]
+        insert_value = [(3, datetime(2018, 12, 31, 23, 59, 59, 993000, tzinfo=timezone.utc), "JKL", "MNO", "PQR".encode('utf-8'))]
+        update_value = [(0, datetime(2018, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc), "JKL", "MNO", "PQR".encode('utf-8'))]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_names=column_name[:-1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+
+        values = insert_value + [
+            (1, datetime(2018, 12, 31, 23, 59, 59, 987000, tzinfo=timezone.utc),
+             "abc", "def", "ghi".encode('utf-8'))] + update_value
+        rows = mssql_cursor_context_manager(*[
+            "select replication_key_column from data_types_database.dbo.text_and_image_deprecated_soon "
+            "where pk in (0, 1,3) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        rows = [("0x{}".format(value.hex().upper()),) for value, in rows]
+        row_with_version = [x[0] + x[1] for x in zip(values, rows)]
+        self.EXPECTED_METADATA['data_types_database_dbo_text_and_image_deprecated_soon']['values'] = row_with_version
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "weirdos"
+        column_name = [
+            "pk", "temp_replication_key_column", "geospacial", "geospacial_map", "markup", "guid", "tree",
+            "variant", "SpecialPurposeColumns", "replication_key_column"]
+        insert_value = [(3, datetime(9999, 12, 31, 23, 59, 59, 993000, tzinfo=timezone.utc),
+                         None, None, None, str(uuid.uuid1()).upper(), None, None, None)]
+        update_value = [(1, datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                         None, None, None, str(uuid.uuid1()).upper(), None, None, None)]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_name[:-1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+
+        values = insert_value + [(2, datetime(9999, 12, 31, 23, 59, 59, 990000, tzinfo=timezone.utc),
+             None, None, None, "B792681C-AEF4-11E9-8002-0800276BC1DF", None, None, None)] + update_value
+        rows = mssql_cursor_context_manager(*[
+            "select replication_key_column from data_types_database.dbo.weirdos "
+            "where pk in (1, 2, 3) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        rows = [("0x{}".format(value.hex().upper()),) for value, in rows]
+        row_with_version = [x[0] + x[1] for x in zip(values, rows)]
+        self.EXPECTED_METADATA['data_types_database_dbo_weirdos']['values'] = row_with_version
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "computed_columns"
+        column_name = ["pk", "temp_replication_key_column", "started_at", "ended_at", "replication_key_column"]
+        insert_value = [(2, datetime(9998, 12, 31, 23, 59, 59, 990000, tzinfo=timezone.utc), datetime(1980, 5, 30, 16), datetime.now())]
+        update_value = [(0, datetime(9998, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc), datetime(1942, 11, 30), datetime(2017, 2, 12))]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_name[:-1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        values = insert_value + [(1, datetime(9998, 12, 31, 23, 59, 59, 987000, tzinfo=timezone.utc),
+             datetime(1970, 1, 1, 0), datetime.now())] + update_value
+        rows = mssql_cursor_context_manager(
+            *["select replication_key_column from data_types_database.dbo.computed_columns "
+              "where pk in (0, 1, 2) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        row_with_duration = [x[0] + x[1] for x in zip(values, rows)]
+        self.EXPECTED_METADATA['data_types_database_dbo_computed_columns']['values'] = row_with_duration
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[1] is not None, row[1]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(expected_row, actual_row))
+                        print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 re.sub(
+                                     r'\d{3}Z',
+                                     "Z",
+                                     max([row[1] for row in stream_expected_data[self.VALUES]])
+                                         .strftime("%Y-%m-%dT%H:%M:%S.%fZ")))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_value')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_incremental_pks.py b/tests/test_sync_incremental_pks.py
new file mode 100644
index 0000000..90d77ad
--- /dev/null
+++ b/tests/test_sync_incremental_pks.py
@@ -0,0 +1,805 @@
+"""
+Test tap discovery
+"""
+from datetime import date, datetime, timezone, time
+
+from dateutil.tz import tzoffset
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk, \
+    create_view
+
+from base import BaseTapTest
+
+
+class SyncPkIncremental(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_incremental_sync_pk_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "no_constraints"
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [(0, ), (1, ), (2, )],
+                'table-key-properties': set(),
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': [
+                    {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True,
+                                               'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'replication_key_column': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True}},
+                    'selected': True}},
+            }
+
+        column_name = ["replication_key_column"]
+        column_type = ["int"]
+        primary_key = set()
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "multiple_column_pk"
+        primary_key = ["first_name", "last_name"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                ("Tim", "Berners-Lee", 64),
+                ("Sergey", "Brin", 45),
+                ("Larry", "Page", 46)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                    {'first_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'last_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'first_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True},  # 'minLength': 0},
+                    'last_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True}  # 'minLength': 0},(1, 4, 2, 5)
+                    }}
+        }
+        column_name = ["first_name", "last_name", "replication_key_column"]
+        column_type = ["varchar(256)", "varchar(256)", "int"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        # Already covered in other tests
+        # table_name = "single_column_pk"
+        # primary_key = ["pk"]
+        # cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+        #     'is-view': False,
+        #     'schema-name': schema_name,
+        #     'row-count': 0,
+        #     'values': [
+        #         (0, 3),
+        #         (1, 4),
+        #         (2, 5)],
+        #     'table-key-properties': primary_key,
+        #     'selected': None,
+        #     'database-name': database_name,
+        #     'stream_name': table_name,
+        #     'fields': [
+        #         {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+        #         {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+        #     'schema': {
+        #         'type': 'object',
+        #         'selected': True,
+        #         'properties': {
+        #             'pk': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer'],
+        #                 'inclusion': 'automatic',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             'replication_key_column': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             "_sdc_deleted_at": {'format': 'date-time', 'type': 'string'}}}
+        # }
+        # column_name = ["pk", "data"]
+        # column_type = ["int", "int"]
+        # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+        #                                primary_key=primary_key, tracking=True))
+        # query_list.extend(insert(database_name, schema_name, table_name,
+        #                          cls.EXPECTED_METADATA['{}_{}_{}'.format(
+        #                              database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_unique_not_null"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4),
+                (2, 5)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "replication_key_column"]
+        column_type = ["int", "int NOT NULL UNIQUE"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_fk"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (3, 1),
+                (1, 0),
+                (2, 0),
+                (0, 1),
+                (4, None)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "replication_key_column"]
+        column_type = ["int", "int"]
+        foreign_key = "replication_key_column"
+        reference = "{}.pk_with_unique_not_null(pk)".format(schema_name)
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def,
+            primary_key=primary_key, foreign_key=foreign_key, reference=reference, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "view_with_join"
+        primary_key = []
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': True,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (1, 4, 0),
+                (0, 3, 1),
+                (0, 3, 2),
+                (1, 4, 3),
+                (None, None, 4)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'column1': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'column1': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        select = ("SELECT p.pk as column1, p.replication_key_column as data, f.pk as replication_key_column "
+                  "FROM pk_with_unique_not_null p "
+                  "RIGHT JOIN pk_with_fk f on p.pk = f.replication_key_column")
+        query_list.extend(create_view(schema_name, table_name, select))
+
+        # This doesn't look to add value
+        # table_name = "table_with_index"
+        # primary_key = []
+        # cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+        #     'is-view': False,
+        #     'schema-name': schema_name,
+        #     'row-count': 0,
+        #     'values': [
+        #         (0, 3),
+        #         (1, 4)],
+        #     'table-key-properties': primary_key,
+        #     'selected': None,
+        #     'database-name': database_name,
+        #     'stream_name': table_name,
+        #     'fields': [
+        #         {'not_pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+        #         {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+        #     'schema': {
+        #         'type': 'object',
+        #         'selected': True,
+        #         'properties': {
+        #             'not_pk': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             'replication_key_column': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648}}}
+        # }
+        # column_name = ["not_pk", "replication_key_column"]
+        # column_type = ["int", "int NOT NULL INDEX myindex"]
+        # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+        #                                primary_key=primary_key))
+        # query_list.extend(insert(database_name, schema_name, table_name,
+        #                          cls.EXPECTED_METADATA['{}_{}_{}'.format(
+        #                              database_name, schema_name, table_name)]["values"]))
+
+        table_name = "default_column"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, ),
+                (1, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "replication_key_column"]
+        column_type = ["int", "int DEFAULT -1"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+                (0, -1),
+                (1, -1)]
+
+        table_name = "check_constraint"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 37),
+                (1, 34)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "replication_key_column"]
+        column_type = ["int", "int CHECK (replication_key_column <= 120)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "even_identity"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (1, ),
+                (2, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'replication_key_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'replication_key_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648}}}
+        }
+        column_name = ["pk", "replication_key_column"]
+        column_type = ["int", "int IDENTITY(2,2)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+            (1, 2),
+            (2, 4)]
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """stream_expected_data[self.VALUES]
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'INCREMENTAL',
+                                                         'replication-key': 'replication_key_column'}}]
+
+        non_selected_properties = []
+
+        BaseTapTest.select_all_streams_and_fields(conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-1]['action'],
+                    'activate_version')
+                self.assertTrue(
+                    all([m["action"] == "upsert" for m in records_by_stream[stream]['messages'][1:-1]]),
+                    msg="Expect all but the first message to be upserts")
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+                replication_column = column_names.index("replication_key_column")
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[replication_column] is not None, row[replication_column]))
+                ]
+
+                # Verify all data is correct for incremental
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[replication_column] for row in stream_expected_data[self.VALUES]
+                                      if row[replication_column] is not None]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_column')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        table_name = "no_constraints"
+        column_name = ["replication_key_column"]
+        insert_value = [(49, )]
+        update_value = [(3, )]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name))
+        query_list.extend([
+            "UPDATE constraints_database.dbo.no_constraints "
+            "SET replication_key_column = 3 "
+            "WHERE replication_key_column = 1"])
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_no_constraints"]["values"] = \
+            [(2, )] + insert_value + update_value
+
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        table_name = "multiple_column_pk"
+        column_name = ["first_name", "last_name", "replication_key_column"]
+        insert_value = [("Brian", "Lampkin", 72)]
+        update_value = [("Sergey", "Brin", 65)]
+        delete_value = [("Larry", "Page")]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:2]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_multiple_column_pk"]["values"] = \
+            [("Tim", "Berners-Lee", 64)] + insert_value + update_value
+
+        # duplicative of other testing
+        # table_name = "single_column_pk"
+        # column_name = ["pk", "replication_key_column"]
+        # insert_value = [(3, 49)]
+        # update_value = [(1, 65)]
+        # delete_value = [(0,)]
+        # query_list = (insert(database_name, schema_name, table_name, insert_value))
+        # query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        # query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        # mssql_cursor_context_manager(*query_list)
+        # insert_value = [insert_value[0] + (None,)]
+        # update_value = [update_value[0] + (None,)]
+        # delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        # self.EXPECTED_METADATA["constraints_database_dbo_single_column_pk"]["values"] = \
+        #     insert_value + delete_value + update_value
+
+        table_name = "pk_with_fk"
+        column_name = ["pk", "replication_key_column"]
+        insert_value = [(5, 2), (6, None)]
+        delete_value = [(1,), (2,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_fk"]["values"] = \
+           [(0, 1), (3, 1)] + insert_value[:-1]
+
+        table_name = "pk_with_unique_not_null"
+        column_name = ["pk", "replication_key_column"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_unique_not_null"]["values"] = \
+            [(2, 5)] + insert_value + update_value
+
+        # update expected datafor VIEW_WITH_JOIN view
+        self.EXPECTED_METADATA["constraints_database_dbo_view_with_join"]["values"] = \
+            [(None, None, 4), (2, 5, 5), (None, None, 6)]
+
+        table_name = "default_column"
+        column_name = ["pk", "replication_key_column"]
+        insert_value = [(3, 49), (4, None), (5, )]
+        update_value = [(1, 65)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value[:2]))
+        query_list.extend(insert(database_name, schema_name, table_name, insert_value[-1:], column_names=column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_default_column"]["values"] = [
+                (0, -1)] + [(3, 49), (5, -1)] + update_value
+
+        table_name = "check_constraint"
+        column_name = ["pk", "replication_key_column"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        self.EXPECTED_METADATA["constraints_database_dbo_check_constraint"]["values"] = \
+            [(0, 37)] + insert_value + update_value
+
+        table_name = "even_identity"
+        column_name = ["pk", "replication_key_column"]
+        insert_value = [(3,)]
+        update_value = [(2,)]
+        delete_value = [(1,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_names=column_name[:1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (6, )]
+        update_value = [update_value[0] + (4, )]
+        self.EXPECTED_METADATA["constraints_database_dbo_even_identity"]["values"] = \
+            insert_value + update_value
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(records_by_stream[stream]['messages'][0]['action'], 'activate_version')
+                self.assertEqual(records_by_stream[stream]['messages'][-1]['action'], 'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:-1]]
+                ))
+                self.assertEqual(len(records_by_stream[stream]['messages'][1:-1]),
+                                 len(stream_expected_data[self.VALUES]),
+                                 msg="incorrect number of upserts")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+                replication_column = column_names.index("replication_key_column")
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, row_values))
+                            if column not in non_selected_properties
+                        }
+                    } for row_values in sorted(stream_expected_data[self.VALUES],
+                                               key=lambda row: (row[replication_column] is not None, row[replication_column]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:-1]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:-1])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+                        print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNone(bookmark.get('current_log_version'), msg="no log_version for incremental")
+                self.assertIsNone(bookmark.get('initial_full_table_complete'), msg="no full table for incremental")
+                # find the max value of the replication key
+                self.assertEqual(bookmark['replication_key_value'],
+                                 max([row[replication_column] for row in stream_expected_data[self.VALUES]
+                                      if row[replication_column] is not None]))
+                # self.assertEqual(bookmark['replication_key'], 'replication_key_column')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_datetime.py b/tests/test_sync_logical_datetime.py
new file mode 100644
index 0000000..34c8dbf
--- /dev/null
+++ b/tests/test_sync_logical_datetime.py
@@ -0,0 +1,550 @@
+"""
+Test tap discovery
+"""
+from datetime import date, datetime, timezone, time, timedelta
+from dateutil.tz import tzoffset
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, delete_by_pk, update_by_pk, enable_database_tracking
+
+from base import BaseTapTest
+
+
+class SyncDateLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_datetime_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).isoformat(),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).isoformat(),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).isoformat(),
+                datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102386, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546280, tzinfo=timezone(timedelta(hours=6, minutes=15))).isoformat(),
+                datetime(2024, 6, 22, 0, 36, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+
+        schema = {
+            'selected': True,
+            'properties': {
+                'its_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null']},
+                'pk': {
+                    'maximum': 2147483647,
+                    'selected': True,
+                    'inclusion': 'automatic',
+                    'type': ['integer'],
+                    'minimum': -2147483648},
+                'just_a_date': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                'date_and_time': {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "bigger_range_and_precision_datetime": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_with_timezones": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "datetime_no_seconds": {
+                    'selected': True,
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'format': 'date-time'},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'type': 'object'}
+
+        feilds = [
+            {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+            {'just_a_date': {'sql-datatype': 'date', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'date_and_time': {'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'bigger_range_and_precision_datetime': {'sql-datatype': 'datetime2', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_with_timezones': {'sql-datatype': 'datetimeoffest', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'datetime_no_seconds': {'sql-datatype': 'smalldatetime', 'selected-by-default': True, 'inclusion': 'available'}},
+            {'its_time': {'sql-datatype': 'time', 'selected-by-default': True, 'inclusion': 'available'}}]
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "dates_and_times"
+        primary_key = {"pk"}
+
+        column_name = ["pk", "just_a_date", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        column_type = ["int", "date", "datetime", "datetime2", "datetimeoffset", "smalldatetime", "time"]
+
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, values))
+
+        mssql_cursor_context_manager(*query_list)
+
+        values = [
+            (
+                0,
+                date(1, 1, 1),
+                datetime(1753, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 0, 0, tzinfo=timezone.utc),
+                datetime(1, 1, 1, 13, 46, tzinfo=timezone(timedelta(hours=-14))).astimezone(timezone.utc),
+                datetime(1900, 1, 1, 0, 0, tzinfo=timezone.utc),
+                time(0, 0, tzinfo=timezone.utc)),
+            (
+                1,
+                date(9999, 12, 31),
+                datetime(9999, 12, 31, 23, 59, 59, 997000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 23, 59, 59, 999000, tzinfo=timezone.utc),
+                datetime(9999, 12, 31, 10, 14, tzinfo=timezone(timedelta(hours=14))).astimezone(timezone.utc),
+                datetime(2079, 6, 6, 23, 59, tzinfo=timezone.utc),
+                time(23, 59, 59, tzinfo=timezone.utc)),
+            (2, None, None, None, None, None, None),
+            (
+                3,
+                date(4533, 6, 9),
+                datetime(3099, 2, 6, 4, 27, 37, 983000, tzinfo=timezone.utc),
+                datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+                datetime(5749, 4, 3, 1, 47, 47, 110809,
+                         tzinfo=timezone(timedelta(hours=10, minutes=5))).astimezone(timezone.utc),
+                datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+                time(21, 9, 56, 0, tzinfo=timezone.utc)),
+            (
+                4,
+                date(3476, 10, 14),
+                datetime(7491, 4, 5, 8, 46, 0, 360000, tzinfo=timezone.utc),
+                datetime(8366, 7, 13, 17, 15, 10, 102386, tzinfo=timezone.utc),
+                datetime(2642, 6, 19, 21, 10, 28, 546280,
+                         tzinfo=timezone(timedelta(hours=6, minutes=15))).astimezone(timezone.utc),
+                datetime(2024, 6, 22, 0, 36, tzinfo=timezone.utc),
+                time(2, 14, 4, 0, tzinfo=timezone.utc))]
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': primary_key,
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': feilds,
+                'schema': schema}
+        }
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, datetime):
+                                # sql server only keeps milliseconds not microseconds
+                                self.assertEqual(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, time):
+                                # sql server time has second resolution only
+                                self.assertEqual(
+                                    expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                    actual_row["data"][column_name],
+                                    msg="expected: {} != actual {}".format(
+                                        expected_value.isoformat().replace('+00:00', 'Z'),
+                                        actual_row["data"][column_name]))
+                            elif isinstance(expected_value, date):
+                                # sql server time has second resolution only
+                                self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                                 actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value.isoformat()+ 'T00:00:00+00:00',
+                                                     actual_row["data"][column_name]))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_value, actual_row["data"][column_name]))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        if isinstance(expected_value, datetime):
+                            # sql server only keeps milliseconds not microseconds
+                            self.assertEqual(
+                                expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                actual_row["data"][column_name],
+                                msg="expected: {} != actual {}".format(
+                                    expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z'),
+                                    actual_row["data"][column_name]))
+                        elif isinstance(expected_value, time):
+                            # sql server time has second resolution only
+                            self.assertEqual(expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                             actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_value.isoformat().replace('+00:00', 'Z'),
+                                                 actual_row["data"][column_name]))
+                        elif isinstance(expected_value, date):
+                            # sql server time has second resolution only
+                            self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                             actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_value.isoformat() + 'T00:00:00+00:00',
+                                                 actual_row["data"][column_name]))
+                        else:
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_value, actual_row["data"][column_name]))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "dates_and_times"
+        column_name = ["pk", "just_a_date", "date_and_time", "bigger_range_and_precision_datetime",
+                       "datetime_with_timezones", "datetime_no_seconds", "its_time"]
+        new_date_value = datetime(2019, 7, 22, 21, 11, 40, 573000)
+        insert_value = [(
+            6,
+            new_date_value.date(),
+            new_date_value,
+            datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+            datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).isoformat(),
+            datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+            time(21, 9, 56, 0, tzinfo=timezone.utc))]
+        update_value = [(
+            2,
+            new_date_value.date(),
+            new_date_value,
+            datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+            datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).isoformat(),
+            datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+            time(21, 9, 56, 0, tzinfo=timezone.utc))]
+        delete_value = [(3, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [(
+            6,
+            new_date_value.date(),
+            new_date_value,
+            datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+            datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).astimezone(timezone.utc),
+            datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+            time(21, 9, 56, 0, tzinfo=timezone.utc))]
+        update_value = [(
+            2,
+            new_date_value.date(),
+            new_date_value,
+            datetime(9085, 4, 30, 21, 52, 57, 492920, tzinfo=timezone.utc),
+            datetime(5749, 4, 3, 1, 47, 47, 110809, tzinfo=timezone(timedelta(hours=10, minutes=5))).astimezone(timezone.utc),
+            datetime(2031, 4, 30, 19, 32, tzinfo=timezone.utc),
+            time(21, 9, 56, 0, tzinfo=timezone.utc))]
+        insert_value = [insert_value[0] + (None, )]
+        update_value = [update_value[0] + (None, )]
+        delete_value = [(3, None, None, None, None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_dates_and_times"]["values"] =  \
+            [self.expected_metadata()["data_types_database_dbo_dates_and_times"]["values"][-1]] + \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_dates_and_times"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}})
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                if isinstance(expected_value, datetime):
+                                    # sql server only keeps milliseconds not microseconds
+                                    self.assertEqual(
+                                        expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z').replace('000', 'Z'),
+                                        actual_row["data"][column_name],
+                                        msg="expected: {} != actual {}".format(
+                                            expected_value.isoformat().replace('000+00:00', 'Z').replace('+00:00', 'Z').replace('000', 'Z'),
+                                            actual_row["data"][column_name]))
+                                elif isinstance(expected_value, time):
+                                    # sql server time has second resolution only
+                                    self.assertEqual(
+                                        expected_value.replace(microsecond=0).isoformat().replace('+00:00', ''),
+                                        actual_row["data"][column_name],
+                                        msg="expected: {} != actual {}".format(
+                                            expected_value.isoformat().replace('+00:00', 'Z'),
+                                            actual_row["data"][column_name]))
+                                elif isinstance(expected_value, date):
+                                    # sql server time has second resolution only
+                                    self.assertEqual(expected_value.isoformat() + 'T00:00:00+00:00',
+                                                     actual_row["data"][column_name],
+                                                     msg="expected: {} != actual {}".format(
+                                                         expected_value.isoformat() + 'T00:00:00+00:00',
+                                                         actual_row["data"][column_name]))
+                                else:
+                                    self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                     msg="expected: {} != actual {}".format(
+                                                         expected_value, actual_row["data"][column_name]))
+
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_decimal.py b/tests/test_sync_logical_decimal.py
new file mode 100644
index 0000000..8595b15
--- /dev/null
+++ b/tests/test_sync_logical_decimal.py
@@ -0,0 +1,555 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+from decimal import getcontext, Decimal
+
+import simplejson
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, delete_by_pk, update_by_pk
+
+from base import BaseTapTest
+
+getcontext().prec = 38
+DECIMAL_PRECISION_SCALE = [(9, 4), (19, 6), (28, 6), (38, 13)]
+NUMERIC_PRECISION_SCALE = [(9, 4), (19, 12), (28, 22), (38, 3)]
+
+
+class SyncDecimalLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_decimal_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        numeric_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999.999999999999'), Decimal('-999999.9999999999999999999999'), Decimal('-99999999999999999999999999999999999.999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9999'), Decimal('9999999.999999999999'), Decimal('999999.9999999999999999999999'), Decimal('99999999999999999999999999999999999.999')),
+            (4, Decimal('96701.9382'), Decimal('-4371716.186100650268'), Decimal('-367352.306093776232045517794'), Decimal('-81147872128956247517327931319278572.985')),
+            (5, Decimal('-73621.9366'), Decimal('2564047.277589545531'), Decimal('336177.4754683699464233786667'), Decimal('46946462608534127558389411015159825.758')),
+            (6, Decimal('-3070.7339'), Decimal('6260062.158440967433'), Decimal('-987006.0035971607740533206418'), Decimal('95478671259010046866787754969592794.61'))]
+
+        numeric_schema = {
+            'type': 'object',
+            'properties': {
+                'numeric_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'numeric_19_12': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-12,
+                    'maximum': 1e7,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e7},
+                'numeric_28_22': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-22,
+                    'maximum': 1e6,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e6},
+                'numeric_38_3': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': .001,
+                    'maximum': 1e35,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e35},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'selected': True}
+
+        decimal_values = [
+            (0, Decimal('-99999.9999'), Decimal('-9999999999999.999999'), Decimal('-9999999999999999999999.999999'), Decimal('-9999999999999999999999999.9999999999999')),
+            (1, 0, 0, 0, 0),
+            (2, None, None, None, None),
+            (3, Decimal('99999.9999'), Decimal('9999999999999.999999'), Decimal('9999999999999999999999.999999'), Decimal('9999999999999999999999999.9999999999999')),
+            (4, Decimal('-92473.8401'), Decimal('-4182159664734.645653'), Decimal('6101329656084900380190.268036'), Decimal('4778017533841887320066645.9761464001349')),
+            (5, Decimal('-57970.8157'), Decimal('7735958802279.086687'), Decimal('4848737828398517845540.057905'), Decimal('2176036096567853905237453.5152648989022')),
+            (6, Decimal('57573.9037'), Decimal('5948502499261.181557'), Decimal('-6687721783088280707003.076638'), Decimal('-6264019242578746090842245.3746225058202'))]
+
+        decimal_schema = {
+            'type': 'object',
+            'properties': {
+                'decimal_9_4': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 0.0001,
+                    'maximum': 1e5,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e5},
+                'decimal_19_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e13,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e13},
+                'decimal_28_6': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-6,
+                    'maximum': 1e22,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e22},
+                'decimal_38_13': {
+                    'exclusiveMaximum': True,
+                    'type': ['number', 'null'],
+                    'selected': True,
+                    'multipleOf': 1e-13,
+                    'maximum': 1e25,
+                    'inclusion': 'available',
+                    'exclusiveMinimum': True,
+                    'minimum': -1e25},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'minimum': -2147483648,
+                    'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'selected': True}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_numeric_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': numeric_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'numeric_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'numeric_9_4': {'sql-datatype': 'numeric(9,4)', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'numeric_19_12': {'sql-datatype': 'numeric(19,12)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'numeric_28_22': {'sql-datatype': 'numeric(28,22)', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'numeric_38_3': {'sql-datatype': 'numeric(38,3)', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': numeric_schema},
+            'data_types_database_dbo_decimal_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': decimal_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'decimal_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'decimal_9_4': {'sql-datatype': 'decimal(9,4)', 'selected-by-default': True,
+                                     'inclusion': 'available'}},
+                    {'decimal_19_6': {'sql-datatype': 'decimal(19,6)', 'selected-by-default': True,
+                                      'inclusion': 'available'}},
+                    {'decimal_28_6': {'sql-datatype': 'decimal(28,6)', 'selected-by-default': True,
+                                       'inclusion': 'available'}},
+                    {'decimal_38_13': {'sql-datatype': 'decimal(38,13)', 'selected-by-default': True,
+                                      'inclusion': 'available'}}],
+                'schema': decimal_schema}}
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        # TODO - BUG https://stitchdata.atlassian.net/browse/SRCE-1075
+        table_name = "numeric_precisions"
+        precision_scale = NUMERIC_PRECISION_SCALE
+        column_type = [
+            "numeric({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["values"]))
+
+        table_name = "decimal_precisions"
+        precision_scale = DECIMAL_PRECISION_SCALE
+        column_type = [
+            "decimal({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        column_type = ["int"] + column_type
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            if isinstance(expected_value, Decimal):
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="decimal value is not represented as a number")
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 simplejson.loads(simplejson.dumps(expected_schemas), use_decimal=True),
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "decimal_precisions"
+        precision_scale = DECIMAL_PRECISION_SCALE
+        column_type = [
+            "decimal({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        insert_value = [
+            (7,
+             Decimal('-92473.8401'),
+             Decimal('-4182159664734.645653'),
+             Decimal('6101329656084900380190.268036'),
+             Decimal('4778017533841887320066645.9761464001349')), ]
+        update_value = [
+            (3,
+             Decimal('-92473.8401'),
+             Decimal('-4182159664734.645653'),
+             Decimal('6101329656084900380190.268036'),
+             Decimal('4778017533841887320066645.9761464001349')), ]
+        delete_value = [(4, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None, )]
+        update_value = [update_value[0] + (None, )]
+        delete_value = [delete_value[0] + (None, None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["values"] = \
+            [self.expected_metadata()["data_types_database_dbo_decimal_precisions"]["values"][-1]] + \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_decimal_precisions"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "numeric_precisions"
+        precision_scale = NUMERIC_PRECISION_SCALE
+        column_type = [
+            "numeric({},{})".format(precision, scale)
+            for precision, scale in precision_scale
+        ]
+        column_name = ["pk"] + [x.replace("(", "_").replace(",", "_").replace(")", "") for x in column_type]
+        insert_value = [
+            (7,
+             Decimal('96701.9382'),
+             Decimal('-4371716.186100650268'),
+             Decimal('-367352.306093776232045517794'),
+             Decimal('-81147872128956247517327931319278572.985')), ]
+        update_value = [
+            (3,
+             Decimal('96701.9382'),
+             Decimal('-4371716.186100650268'),
+             Decimal('-367352.306093776232045517794'),
+             Decimal('-81147872128956247517327931319278572.985')), ]
+        delete_value = [(4, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_numeric_precisions"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                if isinstance(expected_value, Decimal):
+                                    self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                     msg="decimal value is not represented as a number")
+                                    self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                     msg="expected: {} != actual {}".format(
+                                                         expected_row, actual_row))
+                                else:
+                                    self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                     msg="expected: {} != actual {}".format(
+                                                         expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 simplejson.loads(simplejson.dumps(expected_schemas), use_decimal=True),
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_float.py b/tests/test_sync_logical_float.py
new file mode 100644
index 0000000..b41d2dc
--- /dev/null
+++ b/tests/test_sync_logical_float.py
@@ -0,0 +1,414 @@
+"""
+Test tap discovery
+"""
+from decimal import Decimal
+
+from numpy import float32
+
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncFloatLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_float_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        drop_all_user_databases()
+
+        values = [
+            (0, 1.1754944e-38, 2.2250738585072014e-308, 1.1754944e-38),
+            (1, 3.4028235e+38, 1.7976931348623157e+308, 3.4028235e+38),
+            (2, -1.1754944e-38, -2.2250738585072014e-308, -1.1754944e-38),
+            (3, -3.4028235e+38, -1.7976931348623157e+308, -3.4028235e+38),
+            (4, 0.0, 0.0, 0.0),
+            (5, None, None, None),
+            (6, 7.830105e-33, 6.46504535047369e-271, 4.0229383e-27),
+            (7, 4.4540307e-21, 7.205251086772512e-202, 7.196247e-19),
+            (8, 647852.6, 2.1597057137884757e+40, 8.430207e+34),
+            (9, 3603.407, 8.811948588549982e+23, 9.1771755e+35),
+            (10, -8.451405e-24, -1.783306877438393e-178, -2.2775854e-31),
+            (11, -5.8271772e-27, -9.344274532947989e-227, -3.5728205e-18),
+            (12, -8.519153e+23, -2.3035944912603858e+241, -5.7120217e+35),
+            (13, -30306750.0, -5.222263032559684e+106, -1.9535917e+27)]
+
+        schema = {
+            'selected': True,
+            'type': 'object',
+            'properties': {
+                'float_24': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'float_53': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'real_24_bits': {
+                    'selected': True,
+                    'type': ['number', 'null'],
+                    'inclusion': 'available'},
+                'pk': {
+                    'selected': True,
+                    'type': ['integer'],
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'inclusion': 'automatic'},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_float_precisions': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'float_precisions',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'float_24': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'float_53': {'sql-datatype': 'float', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'real_24_bits': {'sql-datatype': 'real', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': schema}}
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "float_precisions"
+        column_name = ["pk", "float_24", "float_53", "real_24_bits"]
+        column_type = ["int", "float(24)", "float(53)", "real"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            column_index = [list(key.keys())[0] for key in
+                                            self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+                            if self.expected_metadata()[stream][self.FIELDS][column_index][column_name][self.DATATYPE] \
+                                    in ("real", "float") \
+                                    and actual_row["data"][column_name] is not None:
+                                self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                 msg="float value is not represented as a number")
+                                self.assertEqual(float(str(float32(expected_value))),
+                                                 float(str(float32(actual_row["data"][column_name]))),
+                                                 msg="single value of {} doesn't match actual {}".format(
+                                                     float(str(float32(expected_value))),
+                                                     float(str(float32(actual_row["data"][column_name]))))
+                                                 )
+                            else:
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        if isinstance(expected_value, float):
+                            self.assertEqual(type(records_by_stream[stream]['messages'][-1]["data"][column_name]),
+                                             Decimal,
+                                             msg="float value is not represented as a number")
+                            self.assertEqual(float(str(float32(expected_value))),
+                                             float(str(float32(
+                                                 records_by_stream[stream]['messages'][-1]["data"][column_name]))),
+                                             msg="single value of {} doesn't match actual {}".format(
+                                                 float(str(float32(expected_value))),
+                                                 float(str(float32(
+                                                     records_by_stream[stream]['messages'][-1]["data"][column_name]))))
+                                             )
+                        else:
+                            self.assertEqual(expected_value,
+                                             records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "float_precisions"
+        column_name = ["pk", "float_24", "float_53", "real_24_bits"]
+        insert_value = [(14, 100.1, 100.1, 100.1)]
+        update_value = [(1, 101.2, 101.2, 101.2)]
+        delete_value = [(5, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [(14, 100.1, 100.1, 100.1, None)]
+        update_value = [(1, 101.2, 101.2, 101.2, None)]
+        delete_value = [(5, None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["values"] = \
+            [self.expected_metadata()["data_types_database_dbo_float_precisions"]["values"][-1]] + \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_float_precisions"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                column_index = [list(key.keys())[0] for key in
+                                                self.expected_metadata()[stream][self.FIELDS]].index(column_name)
+                                if self.expected_metadata()[stream][self.FIELDS][column_index][column_name][
+                                    self.DATATYPE] \
+                                        in ("real", "float") \
+                                        and actual_row["data"][column_name] is not None:
+                                    self.assertEqual(type(actual_row["data"][column_name]), Decimal,
+                                                     msg="float value is not represented as a number")
+                                    self.assertEqual(float(str(float32(expected_value))),
+                                                     float(str(float32(actual_row["data"][column_name]))),
+                                                     msg="single value of {} doesn't match actual {}".format(
+                                                         float(str(float32(expected_value))),
+                                                         float(str(float32(actual_row["data"][column_name]))))
+                                                     )
+                                else:
+                                    self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                     msg="expected: {} != actual {}".format(
+                                                         expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_integers.py b/tests/test_sync_logical_integers.py
new file mode 100644
index 0000000..efaf480
--- /dev/null
+++ b/tests/test_sync_logical_integers.py
@@ -0,0 +1,450 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncIntLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_integer_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_integers': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, -9223372036854775808, -2147483648, -32768),
+                    (1, 0, 0, 0),
+                    (2, 9223372036854775807, 2147483647, 32767),
+                    (3, None, None, None),
+                    (4, 5603121835631323156, 9665315, 11742),
+                    (5, -4898597031243117659, 140946744, -16490),
+                    (6, -5168593529138936444, -1746890910, 2150),
+                    (7, 1331162887494168851, 1048867088, 12136),
+                    (8, -4495110645908459596, -1971955745, 18257),
+                    (9, -1575653240237191360, -533282078, 22022),
+                    (10, 6203877631305833079, 271324086, -18782),
+                    (11, 7293147954924079156, 1003163272, 3593),
+                    (12, -1302715001442736465, -1626372079, 3788),
+                    (13, -9062593720232233398, 1646478731, 17621)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'integers',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyBigIntColumn': {'sql-datatype': 'bigint', 'selected-by-default': True,
+                                        'inclusion': 'available'}},
+                    {'MyIntColumn': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'MySmallIntColumn': {'sql-datatype': 'smallint', 'selected-by-default': True,
+                                          'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MySmallIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -32768,
+                            'maximum': 32767,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk':
+                            {'type': ['integer'],
+                             'minimum': -2147483648,
+                             'maximum': 2147483647,
+                             'inclusion': 'automatic',
+                             'selected': True},
+                        'MyBigIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -9223372036854775808,
+                            'maximum': 9223372036854775807,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'MyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'available',
+                            'selected': True},
+                        "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+                    'selected': True}},
+            'data_types_database_dbo_tiny_integers_and_bools': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 0, False),
+                    (1, 255, True),
+                    (2, None, None),
+                    (3, 230, False),
+                    (4, 6, True),
+                    (5, 236, True),
+                    (6, 27, True),
+                    (7, 132, True),
+                    (8, 251, False),
+                    (9, 187, True),
+                    (10, 157, True),
+                    (11, 51, True),
+                    (12, 144, True)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'tiny_integers_and_bools',
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'MyTinyIntColumn': {'sql-datatype': 'tinyint', 'selected-by-default': True,
+                                         'inclusion': 'available'}},
+                    {'my_boolean': {'sql-datatype': 'bit', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': {
+                    'type': 'object',
+                    'properties': {
+                        'MyTinyIntColumn': {
+                            'type': ['integer', 'null'],
+                            'minimum': 0,
+                            'maximum': 255,
+                            'inclusion': 'available',
+                            'selected': True},
+                        'pk': {
+                            'type': ['integer'],
+                            'minimum': -2147483648,
+                            'maximum': 2147483647,
+                            'inclusion': 'automatic',
+                            'selected': True},
+                        'my_boolean': {
+                            'type': ['boolean', 'null'],
+                            'inclusion': 'available',
+                            'selected': True},
+                        "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+                    'selected': True}}}
+
+        drop_all_user_databases()
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = "integers"
+        column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+        column_type = ["int", "bigint", "int", "smallint"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"]))
+
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+        column_type = ["int", "tinyint", "bit"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "integers"
+        column_name = ["pk", "MyBigIntColumn", "MyIntColumn", "MySmallIntColumn"]
+        insert_value = [(14, 100, 100, 100)]
+        update_value = [(1, 101, 101, 101)]
+        delete_value = [(5, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [(14, 100, 100, 100, None)]
+        update_value = [(1, 101, 101, 101, None)]
+        delete_value = [(5, None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_integers"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_integers"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "tiny_integers_and_bools"
+        column_name = ["pk", "MyTinyIntColumn", "my_boolean"]
+        insert_value = [(14, 100, False)]
+        update_value = [(1, 101, True)]
+        delete_value = [(5,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        insert_value = [(14, 100, False, None)]
+        update_value = [(1, 101, True, None)]
+        delete_value = [(5, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["values"] = \
+            [self.expected_metadata()["data_types_database_dbo_tiny_integers_and_bools"]["values"][-1]] + \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_tiny_integers_and_bools"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+        mssql_cursor_context_manager(*query_list)
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_multiple_dbs.py b/tests/test_sync_logical_multiple_dbs.py
new file mode 100644
index 0000000..7ec3573
--- /dev/null
+++ b/tests/test_sync_logical_multiple_dbs.py
@@ -0,0 +1,652 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk, \
+    create_schema
+
+from base import BaseTapTest
+
+
+class SyncMultLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_multiple_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "database_name"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+        fields = [
+            {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+            {'column_name': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}]
+        schema = {
+            'type': 'object',
+            'properties': {
+                'column_name': {
+                    'type': ['integer', 'null'],
+                    'minimum': -2147483648,
+                    'maximum': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                'pk':
+                    {'type': ['integer'],
+                     'minimum': -2147483648,
+                     'maximum': 2147483647,
+                     'inclusion': 'automatic',
+                     'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'selected': True}
+
+        cls.EXPECTED_METADATA = {
+            '{}_{}_{}'.format(database_name, schema_name, table_name): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': [
+                    (0, 1),
+                    (1, 2)],
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': table_name,
+                'fields': fields,
+                'schema': schema},
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 5),
+                (1, 6)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 7),
+                (1, 8)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        database_name = "DATABASE_NAME_NO_COLLISION"
+        query_list.extend(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        schema_name = "schema_name"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 9),
+                (1, 10)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 11),
+                (1, 12)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        schema_name = "SCHEMA_NAME"
+        query_list.extend(create_schema(database_name, schema_name))
+
+        table_name = "table_name"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 13),
+                (1, 14)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "TABLE_NAME"
+
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 15),
+                (1, 16)],
+            'table-key-properties': {'pk'},
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': fields,
+            'schema': schema
+        }
+
+        column_name = ["pk", "column_name"]
+        column_type = ["int", "int"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        mssql_cursor_context_manager(*query_list)
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "database_name"
+        schema_name = "schema_name"
+        table_name = "table_name"
+        column_name = ["pk", "column_name"]
+        insert_value = [(2, 100)]
+        update_value = [(0, 101,)]
+        delete_value = [(1, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_insert_value = [insert_value[0] + (None,)]
+        meta_update_value = [update_value[0] + (None,)]
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "TABLE_NAME"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        schema_name = "SCHEMA_NAME"
+        table_name = "table_name"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "TABLE_NAME"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "DATABASE_NAME_NO_COLLISION"
+        schema_name = "schema_name"
+        table_name = "table_name"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "TABLE_NAME"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        schema_name = "SCHEMA_NAME"
+        table_name = "table_name"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "TABLE_NAME"
+        column_name = ["pk", "column_name"]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        meta_delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = \
+            meta_insert_value + meta_delete_value + meta_update_value
+        self.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_names.py b/tests/test_sync_logical_names.py
new file mode 100644
index 0000000..215113e
--- /dev/null
+++ b/tests/test_sync_logical_names.py
@@ -0,0 +1,607 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+
+import sys
+from random import randint
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+LOWER_ALPHAS, UPPER_ALPHAS, DIGITS, OTHERS = [], [], [], []
+for letter in range(97, 123):
+    LOWER_ALPHAS.append(chr(letter))
+
+for letter in range(65, 91):
+    UPPER_ALPHAS.append(chr(letter))
+
+for digit in range(48, 58):
+    DIGITS.append(chr(digit))
+
+for invalid in set().union(range(32, 48), range(58, 65), range(91, 97), range(123, 127)):
+    OTHERS.append(chr(invalid))
+
+ALPHA_NUMERIC = list(set(LOWER_ALPHAS).union(set(UPPER_ALPHAS)).union(set(DIGITS)))
+CHAR_NAME = "invalid_characters_{}".format("".join(OTHERS).replace('"', ""))
+VARCHAR_NAME = "1834871389834_start_with_numbers"
+NVARCHAR_NAME = "hebrew_ישראל"
+NCHAR_NAME = "SELECT"
+
+
+class SyncNameLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_names_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        # use all valid unicode characters
+        chars = list(range(0, 55296))
+        chars.extend(range(57344, sys.maxunicode))
+        chars.reverse()  # pop starting with ascii characters
+
+        char_values = [(pk, "".join([chr(chars.pop()) for _ in range(2)])) for pk in range(16)]
+        char_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                CHAR_NAME: {
+                    'type': ['string', 'null'],
+                    'maxLength': 2,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 2},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+
+        varchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(15)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 16))])
+             ) for pk in range(3)
+        ]
+        varchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'varchar_8000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 8000,
+                    'inclusion': 'available',
+                    'selected': True},  # 'minLength': 0},
+                VARCHAR_NAME: {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                'varchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+                # 'minLength': 0}}}
+
+        nchar_values = [
+            (pk,
+             "".join([chr(chars.pop()) for _ in range(4)]))
+            for pk in range(3)
+        ]
+        #  expect that values are right padded with spaces in the db.
+        nchar_values = [(x, "{}{}".format(y, " " * ((16 - len(y.encode('utf-16-le'))) // 2))) for x, y in nchar_values]
+        nchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                NCHAR_NAME: {
+                    'type': ['string', 'null'],
+                    'maxLength': 8,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 8},  # length is based on bytes, not characters
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+
+        chars.reverse()
+        nvarchar_values = [
+            (pk,
+             chr(chars.pop()),
+             "".join([chr(chars.pop()) for _ in range(8)]),
+             "".join([chr(chars.pop()) for _ in range(randint(1, 8))])
+             ) for pk in range(4)
+        ]
+        nvarchar_schema = {
+            'type': 'object',
+            'selected': True,
+            'properties': {
+                'nvarchar_max': {
+                    'type': ['string', 'null'],
+                    'maxLength': 2147483647,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                'pk': {
+                    'maximum': 2147483647,
+                    'type': ['integer'],
+                    'inclusion': 'automatic',
+                    'selected': True,
+                    'minimum': -2147483648},
+                'nvarchar_4000': {
+                    'type': ['string', 'null'],
+                    'maxLength': 4000,
+                    'inclusion': 'available',
+                    'selected': True},
+                # 'minLength': 0},
+                NVARCHAR_NAME: {
+                    'type': ['string', 'null'],
+                    'maxLength': 5,
+                    'inclusion': 'available',
+                    'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+                # 'minLength': 0}}}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_{}'.format(CHAR_NAME): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': char_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': CHAR_NAME,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {CHAR_NAME: {'sql-datatype': 'char', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': char_schema},
+            'data_types_database_dbo_{}'.format(VARCHAR_NAME): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': varchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': VARCHAR_NAME,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {VARCHAR_NAME: {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_8000': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'varchar_max': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': varchar_schema},
+            'data_types_database_dbo_{}'.format(NCHAR_NAME): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': NCHAR_NAME,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {NCHAR_NAME: {'sql-datatype': 'nchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nchar_schema},
+            'data_types_database_dbo_{}'.format(NVARCHAR_NAME): {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': nvarchar_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': NVARCHAR_NAME,
+                'fields': [
+                    {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {NVARCHAR_NAME: {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_4000': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}},
+                    {'nvarchar_max': {'sql-datatype': 'nvarchar', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': nvarchar_schema},
+        }
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        table_name = '"{}"'.format(CHAR_NAME)
+        column_name = ["pk", table_name]  # , "char_8000"]
+        column_type = ["int", "char(2)"]  # , "char(8000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, char_values))
+
+        table_name = "[{}]".format(VARCHAR_NAME)
+        column_name = ["pk", table_name, "varchar_8000", "varchar_max"]
+        column_type = ["int", "varchar(5)", "varchar(8000)", "varchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, varchar_values))
+
+        table_name = "[{}]".format(NCHAR_NAME)
+        column_name = ["pk", "[{}]".format(NCHAR_NAME)]
+        column_type = ["int", "nchar(8)"]  # , "nchar(4000)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        # strip padding off query data
+        nchar_query_values = [
+            (x, y.rstrip() if isinstance(y, str) else y) for x, y in nchar_values]
+        query_list.extend(insert(database_name, schema_name, table_name, nchar_query_values))
+
+        table_name = NVARCHAR_NAME
+        column_name = ["pk", NVARCHAR_NAME, "nvarchar_4000", "nvarchar_max"]
+        column_type = ["int", "nvarchar(5)", "nvarchar(4000)", "nvarchar(max)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+
+        query_list.extend(insert(database_name, schema_name, table_name, nvarchar_values))
+        query_list.extend(['-- there are {} characters left to test'.format(len(chars))])
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+        mssql_cursor_context_manager(*query_list)
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = '"{}"'.format(CHAR_NAME)
+        column_name = ["pk", table_name]
+        insert_value = [(27, "10")]
+        update_value = [(1, "10")]
+        delete_value = [(5, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(CHAR_NAME)]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(CHAR_NAME)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "[{}]".format(VARCHAR_NAME)
+        column_name = ["pk", table_name, "varchar_8000", "varchar_max"]
+        insert_value = [(14, "10", "10", "10")]
+        update_value = [(1, "10", "10", "10")]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(VARCHAR_NAME)]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(VARCHAR_NAME)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "[{}]".format(NCHAR_NAME)
+        column_name = ["pk", table_name]
+        insert_value = [(14, "10101010")]
+        update_value = [(1, "10101010")]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(NCHAR_NAME)]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(NCHAR_NAME)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = NVARCHAR_NAME
+        column_name = ["pk", table_name, "nvarchar_4000", "nvarchar_max"]
+        insert_value = [(14, "10", "10", "10")]
+        update_value = [(1, "10", "10", "10")]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, None, None, datetime.utcnow())]
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(NVARCHAR_NAME)]["values"] = \
+            [self.EXPECTED_METADATA["data_types_database_dbo_{}".format(NVARCHAR_NAME)]["values"][-1]] + \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["data_types_database_dbo_{}".format(NVARCHAR_NAME)]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_others.py b/tests/test_sync_logical_others.py
new file mode 100644
index 0000000..0699167
--- /dev/null
+++ b/tests/test_sync_logical_others.py
@@ -0,0 +1,568 @@
+"""
+Test tap discovery
+"""
+import uuid
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk
+
+from base import BaseTapTest
+
+
+class SyncOtherLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_other_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "data_types_database"
+        schema_name = "dbo"
+
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        text_values = [
+            (0, None, None, None),
+            (1, "abc", "def", "ghi".encode('utf-8'))
+        ]
+        text_schema = {
+            'selected': True,
+            'properties': {
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'rowversion_synonym_timestamp': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']},
+                'varchar_text': {},
+                'nvarchar_text': {},
+                'varbinary_data': {},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'type': 'object'}
+
+        other_values = [
+            (0, None, None, None, "827376B0-AEF4-11E9-8002-0800276BC1DF", None, None, None),
+            (1, None, None, None, "ACC9A986-AEF4-11E9-8002-0800276BC1DF", None, None, None),
+            (2, None, None, None, "B792681C-AEF4-11E9-8002-0800276BC1DF", None, None, None)
+        ]
+        other_schema = {
+            'selected': True,
+            'properties': {
+                'markup': {},
+                'variant': {},
+                'geospacial': {},
+                'SpecialPurposeColumns': {},
+                'tree': {},
+                'guid': {
+                    'inclusion': 'available',
+                    'selected': True,
+                    'pattern': '[A-F0-9]{8}-([A-F0-9]{4}-){3}[A-F0-9]{12}',
+                    'type': ['string', 'null']},
+                'geospacial_map': {},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                'version': {'inclusion': 'available', 'selected': True, 'type': ['string', 'null']},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'type': 'object'}
+
+        comp_values = [
+            (0, datetime(1970, 7, 8, 3), datetime.now()),
+            (1, datetime(1970, 1, 1, 0), datetime.now())
+        ]
+        comp_schema = {
+            'selected': True,
+            'properties': {
+                'started_at': {
+                    'selected': False,
+                    'type': ['string', 'null'],
+                    'inclusion': 'available',
+                    'format': 'date-time'},
+                'durations_days': {
+                    'inclusion': 'available',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer', 'null'],
+                    'selected': True},
+                'ended_at': {
+                    'format': 'date-time',
+                    'inclusion': 'available',
+                    'type': ['string', 'null'],
+                    'selected': False},
+                'pk': {
+                    'inclusion': 'automatic',
+                    'maximum': 2147483647,
+                    'minimum': -2147483648,
+                    'type': ['integer'],
+                    'selected': True},
+                "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+            'type': 'object'}
+
+        cls.EXPECTED_METADATA = {
+            'data_types_database_dbo_text_and_image_deprecated_soon': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': text_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'text_and_image_deprecated_soon',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"nvarchar_text": {'sql-datatype': 'ntext', 'selected-by-default': False,
+                                       'inclusion': 'unavailable'}},
+                    {"varchar_text": {'sql-datatype': 'text', 'selected-by-default': False,
+                                      'inclusion': 'unavailable'}},
+                    {"varbinary_data": {'sql-datatype': 'image', 'selected-by-default': False,
+                                        'inclusion': 'unavailable'}},
+                    {"rowversion_synonym_timestamp": {'sql-datatype': 'timestamp', 'selected-by-default': True,
+                                                      'inclusion': 'available'}}],
+                'schema': text_schema},
+            'data_types_database_dbo_weirdos': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': other_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'weirdos',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"geospacial": {'sql-datatype': 'geometry', 'selected-by-default': False,
+                                    'inclusion': 'unavailable'}},
+                    {"geospacial_map": {'sql-datatype': 'geography', 'selected-by-default': False,
+                                        'inclusion': 'unavailable'}},
+                    {"markup": {'sql-datatype': 'xml', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"guid": {'sql-datatype': 'uniqueidentifier', 'selected-by-default': True,
+                              'inclusion': 'available'}},
+                    {"tree": {'sql-datatype': 'hierarchyid', 'selected-by-default': False, 'inclusion': 'unavailable'}},
+                    {"variant": {'sql-datatype': 'sql_variant', 'selected-by-default': False,
+                                 'inclusion': 'unavailable'}},
+                    {"SpecialPurposeColumns": {'sql-datatype': 'xml', 'selected-by-default': False,
+                                               'inclusion': 'unavailable'}},
+                    {"version": {'sql-datatype': 'timestamp', 'selected-by-default': True, 'inclusion': 'available'}}],
+                'schema': other_schema},
+            'data_types_database_dbo_computed_columns': {
+                'is-view': False,
+                'schema-name': schema_name,
+                'row-count': 0,
+                'values': comp_values,
+                'table-key-properties': {'pk'},
+                'selected': None,
+                'database-name': database_name,
+                'stream_name': 'computed_columns',
+                'fields': [
+                    {"pk": {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {"started_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                    'inclusion': 'available'}},
+                    {"ended_at": {'sql-datatype': 'datetimeoffset', 'selected-by-default': True,
+                                  'inclusion': 'available'}},
+                    {"durations_days": {'sql-datatype': 'int', 'selected-by-default': True,
+                                        'inclusion': 'unavailable'}}],
+                'schema': comp_schema},
+        }
+
+        # test timestamp and usnupported
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["pk", "nvarchar_text", "varchar_text", "varbinary_data",
+                       "rowversion_synonym_timestamp"]
+        column_type = ["int", "ntext", "text", "image", "timestamp"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, text_values, column_name[:-1]))
+
+        # test uniqueidentifier and rowversion
+        table_name = "weirdos"
+        column_name = [
+            "pk", "geospacial", "geospacial_map", "markup", "guid", "tree",
+            "variant", "SpecialPurposeColumns", "version"
+        ]
+        column_type = [
+            "int", "geometry", "geography", "xml", "uniqueidentifier", "hierarchyid",
+            "sql_variant", "xml COLUMN_SET FOR ALL_SPARSE_COLUMNS", "rowversion"
+        ]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        # not sure why I have to do this but getting error - Parameter information is missing from a user-defined type.
+        for value in other_values:
+            query_list.extend(insert(database_name, schema_name, table_name, [value], column_name[:-1]))
+
+        table_name = "computed_columns"
+        column_name = ["pk", "started_at", "ended_at", "durations_days"]
+        column_type = ["int", "datetimeoffset", "datetimeoffset", "AS DATEDIFF(day, started_at, ended_at)"]
+        primary_key = {"pk"}
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name, comp_values, column_name[:-1]))
+        mssql_cursor_context_manager(*query_list)
+
+        # update values with rowversions
+        rows = mssql_cursor_context_manager(*["select version from data_types_database.dbo.weirdos order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_weirdos']['values'] = \
+            [other_values[row] + (version,) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(*[
+            "select rowversion_synonym_timestamp from data_types_database.dbo.text_and_image_deprecated_soon order by pk"])
+        rows = ["0x{}".format(value.hex().upper()) for value, in rows]
+        cls.EXPECTED_METADATA['data_types_database_dbo_text_and_image_deprecated_soon']['values'] = \
+            [text_values[row] + (version,) for row, version in enumerate(rows)]
+
+        rows = mssql_cursor_context_manager(
+            *["select durations_days from data_types_database.dbo.computed_columns order by pk"])
+        cls.EXPECTED_METADATA['data_types_database_dbo_computed_columns']['values'] = \
+            [comp_values[row] + tuple(version) for row, version in enumerate(rows)]
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+
+        # Don't select unsupported data types
+        non_selected_properties = ["nvarchar_text", "varchar_text", "varbinary_data",
+                                   "geospacial", "geospacial_map", "markup", "tree",
+                                   "variant", "SpecialPurposeColumns", "started_at", "ended_at"]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md,
+            non_selected_properties=non_selected_properties)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                            if column not in non_selected_properties
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "text_and_image_deprecated_soon"
+        column_name = ["pk", "nvarchar_text", "varchar_text", "varbinary_data",
+                       "rowversion_synonym_timestamp"]
+        insert_value = [(2, "JKL", "MNO", "PQR".encode('utf-8'))]
+        update_value = [(1, "JKL", "MNO", "PQR".encode('utf-8'))]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_name[:-1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        values = insert_value + update_value
+        rows = mssql_cursor_context_manager(*[
+            "select rowversion_synonym_timestamp from data_types_database.dbo.text_and_image_deprecated_soon "
+            "where pk in (0,1,2) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        rows = [("0x{}".format(value.hex().upper()), ) for value, in rows]
+        row_with_version = [x[0] + x[1] + (None, ) for x in zip(values, rows)]
+        row_with_version.append((0, None, None, None, None, datetime.utcnow()))
+        row_with_version[1], row_with_version[2] = row_with_version[2], row_with_version[1]
+        self.EXPECTED_METADATA['data_types_database_dbo_text_and_image_deprecated_soon']['values'] = row_with_version
+        self.EXPECTED_METADATA["data_types_database_dbo_text_and_image_deprecated_soon"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "weirdos"
+        column_name = [
+            "pk", "geospacial", "geospacial_map", "markup", "guid", "tree",
+            "variant", "SpecialPurposeColumns", "version"]
+        insert_value = [(3, None, None, None, str(uuid.uuid1()).upper(), None, None, None)]
+        update_value = [(1, None, None, None, str(uuid.uuid1()).upper(), None, None, None)]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_name[:-1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        values = insert_value + update_value
+        rows = mssql_cursor_context_manager(*[
+            "select version from data_types_database.dbo.weirdos "
+            "where pk in (0,1,3) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        rows = [("0x{}".format(value.hex().upper()), ) for value, in rows]
+        row_with_version = [x[0] + x[1] + (None, ) for x in zip(values, rows)]
+        row_with_version.append((0, None, None, None, None, None, None, None, None, datetime.utcnow()))
+        row_with_version[1], row_with_version[2] = row_with_version[2], row_with_version[1]
+        self.EXPECTED_METADATA['data_types_database_dbo_weirdos']['values'] = row_with_version
+        self.EXPECTED_METADATA["data_types_database_dbo_weirdos"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        database_name = "data_types_database"
+        schema_name = "dbo"
+        table_name = "computed_columns"
+        column_name = ["pk", "started_at", "ended_at", "durations_days"]
+        insert_value = [(2, datetime(1980, 5, 30, 16), datetime.now())]
+        update_value = [(1, datetime(1942, 11, 30), datetime(2017, 2, 12))]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_name[:-1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        values = insert_value + update_value  # + [delete_value[0] + (None, None)]
+        rows = mssql_cursor_context_manager(
+            *["select durations_days from data_types_database.dbo.computed_columns "
+              "where pk in (0,1,2) order by pk desc"])
+        rows = [tuple(row) for row in rows]
+        row_with_duration = [x[0] + x[1] + (None, ) for x in zip(values, rows)]
+        row_with_duration.append((0, None, None, None, datetime.utcnow()))
+        row_with_duration[1], row_with_duration[2] = row_with_duration[2], row_with_duration[1]
+        self.EXPECTED_METADATA['data_types_database_dbo_computed_columns']['values'] = row_with_duration
+        self.EXPECTED_METADATA["data_types_database_dbo_computed_columns"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                            if column not in non_selected_properties
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
diff --git a/tests/test_sync_logical_pks.py b/tests/test_sync_logical_pks.py
new file mode 100644
index 0000000..4da2ca5
--- /dev/null
+++ b/tests/test_sync_logical_pks.py
@@ -0,0 +1,875 @@
+"""
+Test tap discovery
+"""
+from datetime import datetime, timedelta
+
+from tap_tester import menagerie, runner
+
+from database import drop_all_user_databases, create_database, \
+    create_table, mssql_cursor_context_manager, insert, enable_database_tracking, update_by_pk, delete_by_pk, \
+    create_view
+
+from base import BaseTapTest
+
+
+class SyncPkLogical(BaseTapTest):
+    """ Test the tap discovery """
+
+    EXPECTED_METADATA = dict()
+
+    def name(self):
+        return "{}_logical_sync_pk_test".format(super().name())
+
+    @classmethod
+    def discovery_expected_metadata(cls):
+        """The expected streams and metadata about the streams"""
+
+        return cls.EXPECTED_METADATA
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        """Create the expected schema in the test database"""
+
+        drop_all_user_databases()
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        query_list = list(create_database(database_name, "Latin1_General_CS_AS"))
+        query_list.extend(enable_database_tracking(database_name))
+
+        # pyodbc.ProgrammingError: ('42000', "[42000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]Cannot
+        # enable change tracking on table 'no_constraints'. Change tracking requires a primary key on the table.
+        # Create a primary key on the table before enabling change tracking. (4997) (SQLExecDirectW)")
+        # table_name = "no_constraints"
+        # cls.EXPECTED_METADATA = {
+        #     '{}_{}_{}'.format(database_name, schema_name, table_name): {
+        #         'is-view': False,
+        #         'schema-name': schema_name,
+        #         'row-count': 0,
+        #         'values': [(0, ), (1, )],
+        #         'table-key-properties': set(),
+        #         'selected': None,
+        #         'database-name': database_name,
+        #         'stream_name': table_name,
+        #         'fields': [
+        #             {'column_name': {'sql-datatype': 'int', 'selected-by-default': True,
+        #                              'inclusion': 'available'}}],
+        #         'schema': {
+        #             'type': 'object',
+        #             'properties': {
+        #                 'column_name': {
+        #                     'type': ['integer', 'null'],
+        #                     'minimum': -2147483648,
+        #                     'maximum': 2147483647,
+        #                     'inclusion': 'available',
+        #                     'selected': True},
+        #                 "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}},
+        #             'selected': True}},
+        #     }
+        #
+        # column_name = ["column_name"]
+        # column_type = ["int"]
+        # primary_key = set()
+        # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+        #                                primary_key=primary_key, tracking=True))
+        # query_list.extend(insert(database_name, schema_name, table_name,
+        #                          cls.EXPECTED_METADATA['{}_{}_{}'.format(
+        #                              database_name, schema_name, table_name)]["values"]))
+
+        table_name = "multiple_column_pk"
+        primary_key = ["first_name", "last_name"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                ("Tim", "Berners-Lee", 64),
+                ("Sergey", "Brin", 45),
+                ("Larry", "Page", 46)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                    {'first_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'last_name': {'sql-datatype': 'varchar', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                    {'info': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'info': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'first_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True},  # 'minLength': 0},
+                    'last_name': {
+                        'type': ['string'],
+                        'maxLength': 256,
+                        'inclusion': 'automatic',
+                        'selected': True},  # 'minLength': 0},(1, 4, 2, 5)
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["first_name", "last_name", "info"]
+        column_type = ["varchar(256)", "varchar(256)", "int"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "single_column_pk"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4),
+                (2, 5)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "data"]
+        column_type = ["int", "int"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_unique_not_null"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 3),
+                (1, 4),
+                (2, 5)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'data': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "data"]
+        column_type = ["int", "int NOT NULL UNIQUE"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+                                       primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "pk_with_fk"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 1),
+                (1, 0),
+                (2, 0),
+                (3, 1),
+                (4, None)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'fk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'fk': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "fk"]
+        column_type = ["int", "int"]
+        foreign_key = "fk"
+        reference = "{}.pk_with_unique_not_null(pk)".format(schema_name)
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def,
+            primary_key=primary_key, foreign_key=foreign_key, reference=reference, tracking=True))
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        # CAN'T ENABLE CHANGE TRACKING ON A VIEW
+        # table_name = "view_with_join"
+        # primary_key = []
+        # cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+        #     'is-view': True,
+        #     'schema-name': schema_name,
+        #     'row-count': 0,
+        #     'values': [
+        #         (1, 4, 0),
+        #         (0, 3, 1),
+        #         (0, 3, 2),
+        #         (1, 4, 3),
+        #         (None, None, 4)],
+        #     'table-key-properties': primary_key,
+        #     'selected': None,
+        #     'database-name': database_name,
+        #     'stream_name': table_name,
+        #     'fields': [
+        #         {'column1': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+        #         {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+        #         {'column2': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+        #     'schema': {
+        #         'type': 'object',
+        #         'selected': True,
+        #         'properties': {
+        #             'column1': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             'data': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             'column2': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        # }
+        # select = ("SELECT p.pk as column1, data, f.pk as column2 "
+        #           "FROM pk_with_unique_not_null p "
+        #           "RIGHT JOIN pk_with_fk f on p.pk = f.fk")
+        # query_list.extend(create_view(schema_name, table_name, select))
+
+        # pyodbc.ProgrammingError: ('42000', "[42000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]Cannot
+        # enable change tracking on table 'table_with_index'. Change tracking requires a primary key on the table.
+        # Create a primary key on the table before enabling change tracking. (4997) (SQLExecDirectW)")
+        # table_name = "table_with_index"
+        # primary_key = []
+        # cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+        #     'is-view': False,
+        #     'schema-name': schema_name,
+        #     'row-count': 0,
+        #     'values': [
+        #         (0, 3),
+        #         (1, 4)],
+        #     'table-key-properties': primary_key,
+        #     'selected': None,
+        #     'database-name': database_name,
+        #     'stream_name': table_name,
+        #     'fields': [
+        #         {'not_pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}},
+        #         {'data': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+        #     'schema': {
+        #         'type': 'object',
+        #         'selected': True,
+        #         'properties': {
+        #             'not_pk': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer', 'null'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             'data': {
+        #                 'maximum': 2147483647,
+        #                 'type': ['integer'],
+        #                 'inclusion': 'available',
+        #                 'selected': True,
+        #                 'minimum': -2147483648},
+        #             "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        # }
+        # column_name = ["not_pk", "data"]
+        # column_type = ["int", "int NOT NULL INDEX myindex"]
+        #
+        # column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        # query_list.extend(create_table(database_name, schema_name, table_name, column_def,
+        #                                primary_key=primary_key, tracking=True) )
+        # query_list.extend(insert(database_name, schema_name, table_name,
+        #                          cls.EXPECTED_METADATA['{}_{}_{}'.format(
+        #                              database_name, schema_name, table_name)]["values"]))
+
+        table_name = "default_column"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, ),
+                (1, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'default_column': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'default_column': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "default_column"]
+        column_type = ["int", "int DEFAULT -1"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+                (0, -1),
+                (1, -1)]
+
+        table_name = "check_constraint"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (0, 120),
+                (1, 34)],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'age': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'age': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "age"]
+        column_type = ["int", "int CHECK (age <= 120)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"]))
+
+        table_name = "even_identity"
+        primary_key = ["pk"]
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)] = {
+            'is-view': False,
+            'schema-name': schema_name,
+            'row-count': 0,
+            'values': [
+                (1, ),
+                (2, )],
+            'table-key-properties': primary_key,
+            'selected': None,
+            'database-name': database_name,
+            'stream_name': table_name,
+            'fields': [
+                {'pk': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'automatic'}},
+                {'even_id': {'sql-datatype': 'int', 'selected-by-default': True, 'inclusion': 'available'}}],
+            'schema': {
+                'type': 'object',
+                'selected': True,
+                'properties': {
+                    'pk': {
+                        'maximum': 2147483647,
+                        'type': ['integer'],
+                        'inclusion': 'automatic',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    'even_id': {
+                        'maximum': 2147483647,
+                        'type': ['integer', 'null'],
+                        'inclusion': 'available',
+                        'selected': True,
+                        'minimum': -2147483648},
+                    "_sdc_deleted_at": {'format': 'date-time', 'type': ['string', 'null']}}}
+        }
+        column_name = ["pk", "even_id"]
+        column_type = ["int", "int IDENTITY(2,2)"]
+        column_def = [" ".join(x) for x in list(zip(column_name, column_type))]
+        query_list.extend(create_table(
+            database_name, schema_name, table_name, column_def, primary_key=primary_key, tracking=True) )
+        query_list.extend(insert(database_name, schema_name, table_name,
+                                 cls.EXPECTED_METADATA['{}_{}_{}'.format(
+                                     database_name, schema_name, table_name)]["values"],
+                                 column_names=["pk"]))
+        cls.EXPECTED_METADATA['{}_{}_{}'.format(database_name, schema_name, table_name)]["values"] = [
+            (1, 2),
+            (2, 4)]
+        mssql_cursor_context_manager(*query_list)
+
+        cls.expected_metadata = cls.discovery_expected_metadata
+
+    def test_run(self):
+        """
+        Verify that a full sync can send capture all data and send it in the correct format
+        for integer and boolean (bit) data.
+        Verify that the fist sync sends an activate immediately.
+        Verify that the table version is incremented up
+        """
+        print("running test {}".format(self.name()))
+
+        conn_id = self.create_connection()
+
+        # run in check mode
+        check_job_name = runner.run_check_mode(self, conn_id)
+
+        # verify check  exit codes
+        exit_status = menagerie.get_exit_status(conn_id, check_job_name)
+        menagerie.verify_check_exit_status(self, exit_status, check_job_name)
+
+        # get the catalog information of discovery
+        found_catalogs = menagerie.get_catalogs(conn_id)
+        additional_md = [{"breadcrumb": [], "metadata": {'replication-method': 'LOG_BASED'}}]
+        BaseTapTest.select_all_streams_and_fields(
+            conn_id, found_catalogs, additional_md=additional_md)
+
+        # clear state
+        menagerie.set_state(conn_id, {})
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+
+        # verify record counts of streams
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        # self.assertEqual(record_count_by_stream, expected_count)
+
+        # verify records match on the first sync
+        records_by_stream = runner.get_records_from_target_output()
+
+        table_version = dict()
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                table_version[stream] = records_by_stream[stream]['table_version']
+
+                # verify on the first sync you get
+                # activate version message before and after all data for the full table
+                # and before the logical replication part
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    last_row_data = True
+                else:
+                    last_row_data = False
+
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][-2]['action'],
+                    'activate_version')
+                if last_row_data:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-3]['action'],
+                        'activate_version')
+                else:
+                    self.assertEqual(
+                        records_by_stream[stream]['messages'][-1]['action'],
+                        'activate_version')
+                self.assertEqual(
+                    len([m for m in records_by_stream[stream]['messages'][1:] if m["action"] == "activate_version"]),
+                    2,
+                    msg="Expect 2 more activate version messages for end of full table and beginning of log based")
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # Verify all data is correct for the full table part
+                if last_row_data:
+                    final_row = -3
+                else:
+                    final_row = -2
+
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:final_row])):
+                    with self.subTest(expected_row=expected_row):
+
+                        self.assertEqual(actual_row["action"], "upsert")
+                        self.assertEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+                        for column_name, expected_value in expected_row["data"].items():
+                            self.assertEqual(expected_value, actual_row["data"][column_name],
+                                             msg="expected: {} != actual {}".format(
+                                                 expected_row, actual_row))
+
+                # Verify all data is correct for the log replication part if sent
+                if records_by_stream[stream]['messages'][-1].get("data"):
+                    for column_name, expected_value in expected_messages[-1]["data"].items():
+                        self.assertEqual(expected_value,
+                                         records_by_stream[stream]['messages'][-1]["data"][column_name],
+                                         msg="expected: {} != actual {}".format(
+                                             expected_row, actual_row))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                inital_log_version = bookmark['current_log_version']
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))
+
+        # ----------------------------------------------------------------------
+        # invoke the sync job AGAIN and after insert, update, delete or rows
+        # ----------------------------------------------------------------------
+
+        database_name = "constraints_database"
+        schema_name = "dbo"
+        table_name = "multiple_column_pk"
+        column_name = ["first_name", "last_name", "info"]
+        insert_value = [("Brian", "Lampkin", 49)]
+        update_value = [("Tim", "Berners-Lee", 65)]
+        delete_value = [("Larry", "Page")]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:2]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_multiple_column_pk"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["constraints_database_dbo_multiple_column_pk"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "single_column_pk"
+        column_name = ["pk", "data"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_single_column_pk"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["constraints_database_dbo_single_column_pk"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "pk_with_fk"
+        column_name = ["pk", "fk"]
+        insert_value = [(5, 2)]
+        update_value = [(0, 2)]
+        delete_value = [(1, ), (2, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow()),
+                        delete_value[1] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_fk"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_fk"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        # TODO BUG - https://stitchdata.atlassian.net/browse/SRCE-1300
+        table_name = "pk_with_unique_not_null"
+        column_name = ["pk", "data"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        delete_value = [(0, )]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_unique_not_null"]["values"] = \
+            insert_value + delete_value + update_value  # TODO - add back delete_value
+        self.EXPECTED_METADATA["constraints_database_dbo_pk_with_unique_not_null"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "default_column"
+        column_name = ["pk", "default_column"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_default_column"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["constraints_database_dbo_default_column"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        table_name = "check_constraint"
+        column_name = ["pk", "age"]
+        insert_value = [(3, 49)]
+        update_value = [(1, 65)]
+        delete_value = [(0,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (None,)]
+        update_value = [update_value[0] + (None,)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_check_constraint"]["values"] = \
+            insert_value + delete_value + update_value
+        self.EXPECTED_METADATA["constraints_database_dbo_check_constraint"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        # TODO BUG - https://stitchdata.atlassian.net/browse/SRCE-1300
+        table_name = "even_identity"
+        column_name = ["pk", "even_id"]
+        insert_value = [(3,)]
+        update_value = [(1, )]
+        delete_value = [(2,)]
+        query_list = (insert(database_name, schema_name, table_name, insert_value, column_names=column_name[:1]))
+        query_list.extend(delete_by_pk(database_name, schema_name, table_name, delete_value, column_name[:1]))
+        query_list.extend(update_by_pk(database_name, schema_name, table_name, update_value, column_name))
+        mssql_cursor_context_manager(*query_list)
+        insert_value = [insert_value[0] + (6, None)]
+        update_value = [update_value[0] + (2, None)]
+        delete_value = [delete_value[0] + (None, datetime.utcnow())]
+        self.EXPECTED_METADATA["constraints_database_dbo_even_identity"]["values"] = \
+             insert_value + delete_value + update_value  # TODO - BUG add back delete_value +
+        self.EXPECTED_METADATA["constraints_database_dbo_even_identity"]["fields"].append(
+            {"_sdc_deleted_at": {
+                'sql-datatype': 'datetime', 'selected-by-default': True, 'inclusion': 'automatic'}}
+        )
+
+        sync_job_name = runner.run_sync_mode(self, conn_id)
+
+        # verify tap and target exit codes
+        exit_status = menagerie.get_exit_status(conn_id, sync_job_name)
+        menagerie.verify_sync_exit_status(self, exit_status, sync_job_name)
+        record_count_by_stream = runner.examine_target_output_file(
+            self, conn_id, self.expected_streams(), self.expected_primary_keys_by_stream_id())
+        expected_count = {k: len(v['values']) for k, v in self.expected_metadata().items()}
+        self.assertEqual(record_count_by_stream, expected_count)
+        records_by_stream = runner.get_records_from_target_output()
+
+        for stream in self.expected_streams():
+            with self.subTest(stream=stream):
+                stream_expected_data = self.expected_metadata()[stream]
+                new_table_version = records_by_stream[stream]['table_version']
+
+                # verify on a subsequent sync you get activate version message only after all data
+                self.assertEqual(
+                    records_by_stream[stream]['messages'][0]['action'],
+                    'activate_version')
+                self.assertTrue(all(
+                    [message["action"] == "upsert" for message in records_by_stream[stream]['messages'][1:]]
+                ))
+
+                column_names = [
+                    list(field_data.keys())[0] for field_data in stream_expected_data[self.FIELDS]
+                ]
+
+                expected_messages = [
+                    {
+                        "action": "upsert", "data":
+                        {
+                            column: value for column, value
+                            in list(zip(column_names, stream_expected_data[self.VALUES][row]))
+                        }
+                    } for row in range(len(stream_expected_data[self.VALUES]))
+                ]
+
+                # remove sequences from actual values for comparison
+                [message.pop("sequence") for message
+                 in records_by_stream[stream]['messages'][1:]]
+
+                # Verify all data is correct
+                for expected_row, actual_row in list(
+                        zip(expected_messages, records_by_stream[stream]['messages'][1:])):
+                    with self.subTest(expected_row=expected_row):
+                        self.assertEqual(actual_row["action"], "upsert")
+
+                        # we only send the _sdc_deleted_at column for deleted rows
+                        self.assertGreaterEqual(len(expected_row["data"].keys()), len(actual_row["data"].keys()),
+                                         msg="there are not the same number of columns")
+
+                        for column_name, expected_value in expected_row["data"].items():
+                            if column_name != "_sdc_deleted_at":
+                                self.assertEqual(expected_value, actual_row["data"][column_name],
+                                                 msg="expected: {} != actual {}".format(
+                                                     expected_row, actual_row))
+                            elif expected_value:
+                                # we have an expected value for a deleted row
+                                try:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%S.%fZ")
+                                except ValueError:
+                                    actual_value = datetime.strptime(actual_row["data"][column_name],
+                                                                     "%Y-%m-%dT%H:%M:%SZ")
+                                self.assertGreaterEqual(actual_value, expected_value - timedelta(seconds=15))
+                                self.assertLessEqual(actual_value, expected_value + timedelta(seconds=15))
+                            else:
+                                # the row wasn't deleted so we can either not pass the column or it can be None
+                                self.assertIsNone(actual_row["data"].get(column_name))
+
+                print("records are correct for stream {}".format(stream))
+
+                # verify state and bookmarks
+                state = menagerie.get_state(conn_id)
+                bookmark = state['bookmarks'][stream]
+
+                self.assertIsNone(state.get('currently_syncing'), msg="expected state's currently_syncing to be None")
+                self.assertIsNotNone(
+                    bookmark.get('current_log_version'),
+                    msg="expected bookmark to have current_log_version because we are using log replication")
+                self.assertTrue(bookmark['initial_full_table_complete'], msg="expected full table to be complete")
+                new_log_version = bookmark['current_log_version']
+                self.assertGreater(new_log_version, inital_log_version,
+                                   msg='expected log version to increase')
+
+                self.assertEqual(bookmark['version'], table_version[stream],
+                                 msg="expected bookmark for stream to match version")
+                self.assertEqual(bookmark['version'], new_table_version,
+                                 msg="expected bookmark for stream to match version")
+
+                expected_schemas = self.expected_metadata()[stream]['schema']
+                self.assertEqual(records_by_stream[stream]['schema'],
+                                 expected_schemas,
+                                 msg="expected: {} != actual: {}".format(expected_schemas,
+                                                                         records_by_stream[stream]['schema']))