-
Notifications
You must be signed in to change notification settings - Fork 26
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
K7 / GCScheduler sa po reštarte Kraméria nespustí #1011
Comments
V logu Tomcatu by ve stejnem case, kdy v procesu byla vypsana chyba connection not ready, mela byt videt SQLException s presnym duvodem, proc connection neni k dipozici. Je pravdepodobne, ze je vycerpany connection pool nebo neco podobneho. Mozna by pomohlo zvysit velikost poolu v configuration.properties, defaultni hodnota je |
Áno, SQLException tam je. Ale ako cause sa udáva |
To by mohlo byt zpusobene tim, ze kontejner postgresql jeste neni pripraven a tomcat uz se na nej snazi pripojit - ta vyjimka se objevi zrejme hned pri startu tomcatu, kdyz se startuje thread HikariPool-1. |
@r2it-git je možné uzavřít? |
@zabak nie, keďže stále používame v7.0.29, tak úprava od pána Lahodu u nás ešte nie je nasadená a neviem to replikovať na dev inštancií (na novšej verzií). V každom prípade stále sa to stáva cca raz za 2 týždne, vtedy reštartujem Kramérius manuálne a následne to ide. Uvidíme, možno to nejak súvisí s tými otvorenými socketmi, čo sa riešilo u nás na Slacku v roomke K7. |
Ahoj, nastal ďalší takýto výpadok, počas behu Kraméria a proces ostal zaseknutý v stave catalina.2024-09-11.log Proces logy žiadne neboli, keďže sa ten proces nepustil. Po reštarte Kraméria tento proces zbehol bez problémov. Róbert Randiak - MZK |
Ahoj, problem je v tom, ze Kramerius nemohl navazat spojeni s databazi postgresql. Pritom jeste 11.9. v 5:34 doslo k restartu Tomcatu krameria a to se jeste connection pool inicializoval spravne. V 9:50 ale uz pri pokusu o start procesu connection pool hlasi, ze vsechna spojeni jsou mrtva, nedokaze vytvorti nove, protoze databaze na adrese postgres:5432 neodpovida a proces se tedy nenastartuje. Muzes zkontrolovat, co se v te dobe delo s databazi? |
No k tým logom sa už nedostanem, ale predpokladám, že to mohol byť nejaký výpadok v kubernetes sieťovaní. Ale to by malo byť jedno z akého dôvodu vypadne postgres. |
@pavel-stastny Chyba je zrejme v tom, ze ve tride NextSchedulerTask na radku 54 se pri chybe pri spousteni procesu vypne processScheduler a uz se znovu nespusti. |
@r2it-git Nyní se scheduler po neúspěšném pokusu o spojení neukončuje. V Hikari datasrouce je nastavená proměnná |
Ahoj,
sem tam sa nám stane, že Kramérius prestane spúšťať naplánované procesy. Podľa toho čo som vysledoval, táto situácia nastane keď sa po štarte Kraméria GCScheduler nedokáže pripojiť k db. Nie som si istý prečo sa nedokáže pripojiť, je možné, že to spôsobuje nejaký network výpadok u nás v Kubernetes, neviem. Chyba na ktorej to padá je:
SEVERE [cz.incad.kramerius.processes.impl.GCSchedulerImpl-thread] cz.incad.kramerius.processes.GCFindCandiatesTask.run connection not ready
V každom prípade Kramérius následne beží ďalej ako by sa nič nestalo a spúšťanie procesov už nepôjde, až do ďalšieho reštartu. Keďže Kramérius nespadne, tak ho Kubernetes nereštartuje, lebo podľa neho je všetko ok. Preto by som navrhoval aby na tejto chybe Kramérius spadol, alebo aby sa scheduler pokúsil o pripojenie na viac krát, alebo nejaký iný fix.
Prikladám logy z Kraméria z dvoch takýchto výpadkov, a logy z procesov, ktoré v tom čase bežali. V logoch procesov podľa mňa nič zaujímave nie je, ale pribalil som ich pre úplnosť.
logs.zip
Róbert, MZK - OSDD
The text was updated successfully, but these errors were encountered: