Seite 1 von 1

[V4.1] HTTP-API von www.verfassungsschutz.de

Verfasst: Mo Jan 13, 2025 8:09 am
von Eraser
Hallo,

ich möchte gerne auf folgender Webseite einen Wert abfragen:

https://www.verfassungsschutz.de/DE/the ... _node.html

Es geht um das erste Datum:
/html/body/div/div/main/div/div[1]/div/div/div[6]/div/table/tbody/tr[2]/td[1]

Eine Rest-API, welche die Werte per JSON zurückgibt, hat diese Webseite anscheinend nicht.

Ist es möglich mit der HTTP-API des TW diesen Wert abzufragen, sodass ich dann später im Logik-Editor einen Vergleich erstellen kann um zu sehen, ob sich das Datum geändert hat bzw. ob ein neuer Eintrag dazu gekommen ist? Oder verlangt die HTTP-API immer ein JSON als Antwort?

Danke

Re: [V4.1] HTTP-API von www.verfassungsschutz.de

Verfasst: Mo Jan 13, 2025 8:09 pm
von ms20de
Hallo Wolfgang,

mit der HTTP-API ist es möglich, den Quellcode einer Webseite abzufragen und diesen als String an das Objektsystem weiterzuleiten.

In der Logik könnte man das RegEx-Modul nutzen, um den Inhalt des Quelltextes nach dem gewünschten Wert zu durchsuchen. Dabei ergeben sich jedoch zwei Probleme:

A) Die Verarbeitung von Zeichenketten in der Logik-Engine ist derzeit auf 64 Kilobyte limitiert. Das Ziel bei der Entwicklung war es, keine umfangreiche Textverarbeitung durchzuführen, sondern tausende Steuervorgänge im Smart Home pro Sekunde schnell und stabil auszuführen. Aktuell kenne ich kein anderes Produkt, das eine vergleichbare Leistung bietet.

B) Wenn sich der Quelltext der Seite ändert, insbesondere bei redaktionellem Inhalt aus einem CMS, muss die RegEx-Lösung damit umgehen können. Funktioniert die Seite nur mit einem Programm, das einen Wert austauscht, wird es wahrscheinlich klappen. Ändert jedoch jemand die Seitenstruktur, bricht die Lösung zusammen.

Viele Grüße,
Matthias

Re: [V4.1] HTTP-API von www.verfassungsschutz.de

Verfasst: Mo Jan 13, 2025 8:38 pm
von Eraser
Danke für die Klarstellung, kenne mich beim Website scrapen nicht so aus.

Im Quellcode ist der Wert nicht hinterlegt, da werden andere Java-Sachen oder so vorher noch gemacht.

Habe es mit Browse.ai nun gelöst.

Webseite->Browse.ai->per API zu Node-Red(Container am TW)->per MQTT zum TW->auf die Visu des TW

Kann auf Gelöst gesetzt werden.