-
Notifications
You must be signed in to change notification settings - Fork 20
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
ARTE: keine aktuellen Filme mehr #191
Comments
Zwischenstand: Ich habe im Code in einem Kommentar mit TODO einen Lösungsweg beschrieben, falls jemand vor mir Zeit hat, sich darum zu kümmern. |
Ich guck es mir mal an. |
So klappt soweit ist aber noch nicht hübsch gemacht. |
Conflicts: src/main/java/mServer/crawler/sender/arte/ArteDatenFilmDeserializer.java src/main/java/mServer/crawler/sender/arte/ArteJsonObjectToDatenFilmCallable.java src/main/java/mServer/crawler/sender/arte/MediathekArte_de.java
Ich hab den Fix gerade noch etwas getestet. Zwei Punkte sind mir aufgefallen:
@alex1702 @Nicklas2751 Ich schlage vor, dass wir das erst fixen, bevor wir den Hotfix auf die Crawler bringen, um unnötige Forumsdiskussionen zu vermeiden. |
ähm ja könnte knapp sein bevor der neue verwendet wird. hatte nicht auf Plausibilität geprüft nur ob Daten bis auf livestream da sind. |
ok crawler sind erstmal wieder bei der vorherigen version. |
hast du schon eine idee wie wir rausfinden welches Ausstrahlungsdatum das richtige ist? |
Ich hab es im Branch aktuell hinbekommen, dass das Erstausstrahlungsdatum verwendet wird. Führt bei Wiederholung dazu, dass Einträge, die z.B. gestern gelaufen sind, für das Jahr 2015 gelistet werden. Die ARTE-Struktur beinhaltet folgende Infos:
Ich habe leider keine gute Idee, wie ich erkennen kann, dass in Beispiel 1 MAJOR_REBROADCAST statt FIRST_BROADCAST der richtige Eintrag ist, in Beispiel 2 aber FIRST_BROADCAST korrekt ist. Einzig vielleicht eine Logik wie: wenn MAJOR_REBROADCAST <= "heute", dann MAJOR_REBROADCAST, sonst FIRST_BROADCAST. Habt ihr andere Ideen? Sollten wir diese Logik einbauen? |
Bei den Beispielen kriege ich ein 401 Fehler ... entweder oAuth oder Geo. Wenn diese als vollkommene .txt-Dateien vorhanden wären, würde ich sie gerne mal anschauen. |
@zxsd Man braucht den Token zum authentifizieren. Also ich bin mir im moment unsicher welches Datum man eigentlich nehmen sollte. Theoretisch plädiere ich garnicht mehr dazu das Datum der Erstausstrahlung zu nehmen, weil wenn ich grad ein Film oder so z.B. im TV verpasst habe oder nachträglich den gucken will oder halt zukünftig den gucken möchte, dann suche ich ja nach dem aktuellen Datum und nicht 2 Jahre zurück. Außer ich suche halt über Titel/Thema/Sender. Zum aktuellen Zeitpunkt weiß ich nicht was jetzt besser wäre letzte mögliche Ausstrahlung oder erste. So wie ich das aktuell anhand der Beispiele gesehen habe scheint arte auch von oben nach unten aktueller zu werden. Warum die son schwachsinn wie major und minor rebroadcast machen erschließt sich mir aber noch nicht. |
@zxsd |
Und was machen wir bei solchen Sendungen: |
@alex1702 ... Danke aber funzen tat es nicht (FF-nativ und DownThemAll, wie abgebildet). |
... könnte Verwirrung stiften. Wenn die anderen Daten zusätzlich im (vergrößerten) Beschreibungsfeld hineingeschrieben worden wären -- beispielsweise mit Verkettungszeichen als Abgrenzung (wie in den Statusleisten), und Sternchen (für den aktiven Wert) -- könnte eventuell ein wißbegieriger User daraus Sinn machen. Derartige MServer-Änderungen müßten aber mit MediathekView-Änderungen erfolgen ... und es ginge zwei Zeilen 'verloren.' (Daten sind aus obigem Beispiel 1.) Wie ich 'mal beim ZDF postulierte, wenn ein Depublizierungsdatum vorhanden wäre, könnte man mittels diesem wohl das derzeit 'richtige' Publizierungsdatum feststellen. |
@zxsd Warum hast du an die Links was dran gehängt? die kannst du so im browser öffnen mit drauf klicken. |
^^^^^ . . . . Bin eben Angsthase <g>. Mutmaßungen ... (hauptsächlich Beispiel 1 berücksichtigt) Wenn die Sendung keine Erstausstrahlung ist, wird es wohl wie Beispiel 1 veröffentlicht; sonst wie Beispiel 2.
Im ersten Beispiel scheint
Anmerkung: Das Datum im Mittels eine IE-only Seite habe ich folgende interessante Werten bezüglich Beispiel 1 gefunden:
|
@zxsd Danke für die Analysen. Ich werde heute Abend mal ausprobieren, was passiert, wenn ich die |
Die Logik funktioniert in den meisten Fällen korrekt. Leider gibt es noch ein paar Filme, bei denen die Ausstrahlung vor dem Onlinezeitraum liegt, z.B. http://www.arte.tv/de/videos/071363-007-A/paare Das muss ich mir nochmal anschauen. |
Offensichtlich bin ich nicht schlau genug ... Kann mir jemand sagen was ich falsch tue?
|
@zxsd wie wäre es mit einfach link anklicken? es ist eine ARTE Mediathek seite und keine api url. |
ich wollte allen, die sich um eine Arte-Lösung kümmern und einsetzen mal in diesem Rahmen hier ganz herzlich danken, ich habe technisch keine Ahnung und kann nur anbieten zu helfen, wenn es hilft!? |
@alex1702 ... Ich wollte halt die API-Angaben anschauen. Mir wurde erst vom @Nicklas2751 beigebracht, daß Seiten-Quelltexte nicht API-Angaben widerspiegeln. (Und ob! <g>) Laut Seite-Quelltext (Zeile 288) ist diese Sendung: Nicht 'mal die Player-Config-Seite enthält das Datum im API-geliefertem Format ... aber was ähnliches ist vorhanden: Ohne Crawler, versuche ich die API-Angaben selbst zu holen. Mir gelingt es nicht, deswegen meine Frage. |
@zxsd So geht es: Benutze aber selber Insomnia für die Requests. |
^^^^^ Danke! Vollständigkeitshalber (und vom curl-Kommando dankend übernommen), geht's auch mit wget. Durch folgende Meldung habe ich mir gedacht,
|
Ich würde vorschlagen, man erfasst FIRST_BROADCAST, MAJOR_REBROADCAST und MINOR_REBROADCAST und nimmt von den Daten das, was am nächsten an heute dran ist also den geringsten Abstand hat. Bei Beispiel 1 hätte also würde ich hier den 06.07.2017 als Datum nehmen. Und beim neuen Film Objekt im MLib dvelop würde ich entsprechend auch noch das Datum wieder aus dem equals und hashcode raus nehmen und das ganze auf Duration, Titel, Thema, Sender, Urls, GeoLocs und Subtitles eingrenzen. |
Wie ich gesehen habe entsprich dies ja auch dem Verhalten wie @pidoubleyou mit fec7236 eingebaut hat. Der aktuelle branch stand sollte damit m.M passen. @alex1702 Hast du den mal geteset? |
Conflicts: src/main/java/mServer/crawler/sender/arte/ArteJsonObjectToDatenFilmCallable.java
Jetzt sieht es gut aus. Für alle Einträge wird ein sinnvolles Ausstrahlungsdatum gesetzt. |
also steht einem release nix im weg? |
Pull Request habe ich erstellt, kannst du mergen und releasen. |
Conflicts: src/main/java/mServer/crawler/sender/arte/ArteJsonObjectToDatenFilmCallable.java src/main/java/mServer/tool/DateWithoutTimeComparer.java
Wurde auch zu Develop gemerged. Änderung: Nutzung von LocalDateTime statt dem veralteten Calendar. + LocalDateTime statt Strings da die neue Film klasse ja ein LocalDateTime statt einem String erwartet. |
Hi all – arte.tv is back again – never change a winning team! HE |
Wie im Forumgemeldet, gibt es ab dem 1.7. keine neuen ARTE-Filme mehr.
Die API für die Ermittlung der Filme, die an einem Tag gelaufen sind, gibt es nicht mehr.
The text was updated successfully, but these errors were encountered: