[CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing #95360

droberts195 · 2023-04-19T10:05:09Z

Build scan:
https://gradle-enterprise.elastic.co/s/txo4anowmywnm/tests/:x-pack:qa:rolling-upgrade:v8.2.0%23twoThirdsUpgradedTest/org.elasticsearch.upgrades.MlTrainedModelsUpgradeIT/testTrainedModelInference

Reproduction line:

./gradlew ':x-pack:qa:rolling-upgrade:v8.2.0#twoThirdsUpgradedTest' -Dtests.class="org.elasticsearch.upgrades.MlTrainedModelsUpgradeIT" -Dtests.method="testTrainedModelInference" -Dtests.seed=D0F64DC8162BB439 -Dtests.bwc=true -Dtests.locale=be-BY -Dtests.timezone=Africa/Lubumbashi -Druntime.java=20

Applicable branches:
main

Reproduces locally?:
Didn't try

Failure history:
https://gradle-enterprise.elastic.co/scans/tests?tests.container=org.elasticsearch.upgrades.MlTrainedModelsUpgradeIT&tests.test=testTrainedModelInference

Failure excerpt:

org.elasticsearch.client.ResponseException: method [GET], host [http://[::1]:34607], URI [_ml/trained_models/_all/_stats], status line [HTTP/1.1 500 Internal Server Error]
{"error":{"root_cause":[{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"uri_parts","suppressed":[{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"uri_parts"},{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"foreach"}]}],"type":"exception","reason":"unexpected failure gathering pipeline information","caused_by":{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"uri_parts","suppressed":[{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"uri_parts"},{"type":"parse_exception","reason":"processor [uri_parts] doesn't support one or more provided configuration parameters [ignore_missing]","processor_type":"foreach"}]}},"status":500}

  at __randomizedtesting.SeedInfo.seed([D0F64DC8162BB439:4F7A036EC7A2D7FA]:0)
  at org.elasticsearch.client.RestClient.convertResponse(RestClient.java:347)
  at org.elasticsearch.client.RestClient.performRequest(RestClient.java:313)
  at org.elasticsearch.client.RestClient.performRequest(RestClient.java:288)
  at org.elasticsearch.upgrades.MlTrainedModelsUpgradeIT.getTrainedModelStats(MlTrainedModelsUpgradeIT.java:103)
  at org.elasticsearch.upgrades.MlTrainedModelsUpgradeIT.testTrainedModelInference(MlTrainedModelsUpgradeIT.java:78)
  at jdk.internal.reflect.DirectMethodHandleAccessor.invoke(DirectMethodHandleAccessor.java:104)
  at java.lang.reflect.Method.invoke(Method.java:578)
  at com.carrotsearch.randomizedtesting.RandomizedRunner.invoke(RandomizedRunner.java:1758)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$8.evaluate(RandomizedRunner.java:946)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$9.evaluate(RandomizedRunner.java:982)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$10.evaluate(RandomizedRunner.java:996)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at org.apache.lucene.tests.util.TestRuleSetupTeardownChained$1.evaluate(TestRuleSetupTeardownChained.java:48)
  at org.apache.lucene.tests.util.AbstractBeforeAfterRule$1.evaluate(AbstractBeforeAfterRule.java:43)
  at org.apache.lucene.tests.util.TestRuleThreadAndTestName$1.evaluate(TestRuleThreadAndTestName.java:45)
  at org.apache.lucene.tests.util.TestRuleIgnoreAfterMaxFailures$1.evaluate(TestRuleIgnoreAfterMaxFailures.java:60)
  at org.apache.lucene.tests.util.TestRuleMarkFailure$1.evaluate(TestRuleMarkFailure.java:44)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at com.carrotsearch.randomizedtesting.ThreadLeakControl$StatementRunner.run(ThreadLeakControl.java:390)
  at com.carrotsearch.randomizedtesting.ThreadLeakControl.forkTimeoutingTask(ThreadLeakControl.java:843)
  at com.carrotsearch.randomizedtesting.ThreadLeakControl$3.evaluate(ThreadLeakControl.java:490)
  at com.carrotsearch.randomizedtesting.RandomizedRunner.runSingleTest(RandomizedRunner.java:955)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$5.evaluate(RandomizedRunner.java:840)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$6.evaluate(RandomizedRunner.java:891)
  at com.carrotsearch.randomizedtesting.RandomizedRunner$7.evaluate(RandomizedRunner.java:902)
  at org.apache.lucene.tests.util.AbstractBeforeAfterRule$1.evaluate(AbstractBeforeAfterRule.java:43)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at org.apache.lucene.tests.util.TestRuleStoreClassName$1.evaluate(TestRuleStoreClassName.java:38)
  at com.carrotsearch.randomizedtesting.rules.NoShadowingOrOverridesOnMethodsRule$1.evaluate(NoShadowingOrOverridesOnMethodsRule.java:40)
  at com.carrotsearch.randomizedtesting.rules.NoShadowingOrOverridesOnMethodsRule$1.evaluate(NoShadowingOrOverridesOnMethodsRule.java:40)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at org.apache.lucene.tests.util.TestRuleAssertionsRequired$1.evaluate(TestRuleAssertionsRequired.java:53)
  at org.apache.lucene.tests.util.AbstractBeforeAfterRule$1.evaluate(AbstractBeforeAfterRule.java:43)
  at org.apache.lucene.tests.util.TestRuleMarkFailure$1.evaluate(TestRuleMarkFailure.java:44)
  at org.apache.lucene.tests.util.TestRuleIgnoreAfterMaxFailures$1.evaluate(TestRuleIgnoreAfterMaxFailures.java:60)
  at org.apache.lucene.tests.util.TestRuleIgnoreTestSuites$1.evaluate(TestRuleIgnoreTestSuites.java:47)
  at com.carrotsearch.randomizedtesting.rules.StatementAdapter.evaluate(StatementAdapter.java:36)
  at com.carrotsearch.randomizedtesting.ThreadLeakControl$StatementRunner.run(ThreadLeakControl.java:390)
  at com.carrotsearch.randomizedtesting.ThreadLeakControl.lambda$forkTimeoutingTask$0(ThreadLeakControl.java:850)
  at java.lang.Thread.run(Thread.java:1623)

The text was updated successfully, but these errors were encountered:

elasticsearchmachine · 2023-04-19T10:05:33Z

Pinging @elastic/ml-core (Team:ML)

davidkyle · 2023-04-19T11:14:55Z

Mute in #95363

davidkyle · 2023-04-19T11:43:53Z

MLModelDeploymentsUpgradeIT::testTrainedModelDeployment is also failing with the same error

https://gradle-enterprise.elastic.co/s/txo4anowmywnm/tests/:x-pack:qa:rolling-upgrade:v8.2.0%23twoThirdsUpgradedTest/org.elasticsearch.upgrades.MLModelDeploymentsUpgradeIT/testTrainedModelDeployment

davidkyle · 2023-05-03T08:48:51Z

I opened #95766 to discuss the root cause.

The ml get trained model stats API stopped parsing the full ingest pipeline in v8.3.1 (#87978), upgrades tests after that version will pass. One way to re-enable these tests in the short term is only call get stats if the starting version is >= 8.3.1

droberts195 · 2023-05-03T08:59:52Z

One way to re-enable these tests in the short term is only call get stats if the starting version is >= 8.3.1.

Yes, I agree this is a good idea.

The underlying problem is nothing to do with ML, so it's bad that we have our upgrade tests disabled because of it.

It's better that we have some coverage for ML trained model upgrades, particularly between 8.7 and 8.8 where we've changed a few things.

Please add a comment to say why the test is skipping versions <= 8.3.0, and a TODO to remove that if the problematic index template is fixed. (I guess the proper fix would be for the new Enterprise Search functionality to only be installed into the cluster once all nodes have been upgraded to a version that understands the syntax. But that's outside our scope to decide.)

droberts195 added :ml Machine learning >test-failure Triaged test failures from CI labels Apr 19, 2023

elasticsearchmachine added the Team:ML Meta label for the ML team label Apr 19, 2023

davidkyle mentioned this issue Apr 19, 2023

[ML] Mute MlTrainedModelsUpgradeIT #95363

Merged

davidkyle changed the title ~~[CI] MlTrainedModelsUpgradeIT testTrainedModelInference failing~~ [CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing Apr 19, 2023

This was referenced May 2, 2023

[ML] Fix upgrade test assertion #95748

Merged

behavioral_analytics-events-final_pipeline parsing fails in a mixed cluster #95766

Closed

davidkyle mentioned this issue May 3, 2023

[ML] Re-enable upgrade tests with workaround for invalid pipeline config #95778

Merged

davidkyle closed this as completed in #95778 May 3, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing #95360

[CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing #95360

droberts195 commented Apr 19, 2023

elasticsearchmachine commented Apr 19, 2023

davidkyle commented Apr 19, 2023

davidkyle commented Apr 19, 2023

davidkyle commented May 3, 2023

droberts195 commented May 3, 2023

[CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing #95360

[CI] MlTrainedModelsUpgradeIT testTrainedModelInference and MLModelDeploymentsUpgradeIT failing #95360

Comments

droberts195 commented Apr 19, 2023

elasticsearchmachine commented Apr 19, 2023

davidkyle commented Apr 19, 2023

davidkyle commented Apr 19, 2023

davidkyle commented May 3, 2023

droberts195 commented May 3, 2023