Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Fjerner tasktimer - bedre å query slutt-start for å tune #475

Merged
merged 2 commits into from
Sep 12, 2023

Conversation

jolarsen
Copy link
Collaborator

@jolarsen jolarsen commented Sep 9, 2023

Beholder opptelling av antall klar/feilet/... med mellomrom 3-9 minutt (må bruke max over alle pods i PrometheusQL).
Fjerner task-timer. Ganske mange task-typer fra fpsak.
Det er generelt sett enklere å analysere oppførsel ved å kjøre query slutt-start mot prosess_task-tabell over periode for å se de som er godt over medianen. Enkelte (fortsettBehandling) vil ha svært varierende kjøretid (<1s for ett steg til 30s for fullauto).

@jolarsen jolarsen requested a review from a team as a code owner September 9, 2023 19:40
Copy link
Collaborator

@espenwaaga espenwaaga left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Bruker ikke denne i alerts i det minste. Hva var tanken bak denne? Har vi en grafana oversikt over kjøretiden til samtlige prosesstasks? Har det blitt brukt og kommer det til å være aktuelt videre?

Så hvis jeg forstår riktig så ønsker du å fjerne denne siden det ikke brukes og heller erstatte med en manuell oppgave når det skulle være behov? Når er det da eventuelt behov?

@jolarsen
Copy link
Collaborator Author

Tanken som har vært tidligere er å oppdage tilfelle som har kjøretid over 95 eller 99 percentiler med sikte på optimalisering og evt unngå "ingen ledige tasks" .
Har sett på både klient- og serverside histogram og mer avsensert PromQL. Siden pod logger det som er kjørt lokalt må man aggregere over alle pods sum by [intervall] .
I praksis er det like greit med analytiske queries mot task-tabell for å identifisere trege task-typer.

@jolarsen
Copy link
Collaborator Author

Når løsningen er så stabil som den er så er task-tid noe man ser på halvårlig. Mest for å se om noen underliggende queries ikke skalerer med økende datavolum

@jolarsen jolarsen merged commit 94054f4 into master Sep 12, 2023
6 checks passed
@jolarsen jolarsen deleted the feature/forenkle-taskmonitor branch September 12, 2023 07:31
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants