Analyst Toolkit

Webdaten: Eine zuverlässige Quelle für Marktanalysen?

Unternehmenswebseiten sind meist verlässlich, da Firmen ein Interesse an korrekten und aktuellen Informationen haben. Mit zusätzlicher Validierung – wie bei ISTARI.AI – entsteht ein sehr wertvoller Datenpool.
Header image

Wie zuverlässig sind Informationen von Unternehmenswebseiten?

Eine Frage, die mir in Gesprächen mit Kunden und Forschungspartnern immer wieder begegnet: „Kann man euren Webdaten überhaupt vertrauen? Unternehmen können auf ihren Websites doch schreiben, was sie wollen." Das ist eine berechtigte Frage.

Die ehrliche Antwort vorweg: Nein, wir haben keinen eingebauten Lügendetektor. Wenn ein Unternehmen behauptet, ISO 27001-zertifiziert zu sein und das aber nicht ist, können wir das im ersten Moment nicht automatisch widerlegen. Aber nach Jahren der Arbeit mit webbasierten Indikatoren in der Forschung und in der alltäglichen Praxis, habe ich ein differenziertes Bild gewonnen, das ich hier teilen möchte.

Welche Informationen werden von Unternehmen veröffentlicht?

Bei ISTARI.AI extrahieren wir mit KI-Agenten strukturierte Informationen aus den Webseiten von Millionen von Unternehmen weltweit. Das machen wir schon seit 2019, also lange bevor ChatGPT KI einer breiteren Öffentlichkeit zugänglich machte – und ich beschäftige mich wissenschaftlich bereits seit fast 10 Jahren mit der Frage, was Webdaten über Unternehmen verraten können. Meine Erfahrung und verschiedene wissenschaftliche Studien haben gezeigt: Unternehmen haben ein starkes Eigeninteresse daran, auf ihren Webseiten vornehmlich korrekte Informationen zu präsentieren.

Die Logik dahinter ist simpel. Jeder Webseitenbesucher ist erst einmal ein potenzieller Kunde. Unternehmen wollen, dass man versteht, was sie anbieten. Natürlich geschieht das in positivem Framing. Insbesondere die Kerninformationen über angebotene Produkte und Dienstleistungen, werden bereitwillig und meist detailliert kommuniziert und aktuell gehalten. Hier haben Unternehmen den stärksten Anreiz zur Vollständigkeit.

Unternehmen kommunizieren aber auch strategische Signale und Interna vor allem dann, wenn sie einer positiv wahrgenommenen Agenda dienen. Beispiele hierfür sind positiv besetzte Themen wie Nachhaltigkeit („Wir produzieren mit 100% Ökostrom"), Innovation („Unsere neue Technologie X ist eine Weltneuheit") und Wachstum (neue Standorte, Expansionspläne). Klassisches „Signaling“ also, dass aber verwertbare und potenziell wertvolle Informationen für Marktanalysen enthält.

Auch gibt es neben aktiv kommunizierter (der neue CEO stellt sich selbst und seine Vision vor), häufig auch passiv erkennbare Informationen (Geschäftsführer im Impressum ändert sich). Dazu gehören mit Stellenausschreibungen ein weiterer, oft unterschätzter Informationsschatz. Die Rollen und Fähigkeiten, die ein Unternehmen sucht, verraten viel über dessen technologische Ausrichtung, interne Wachstumsbereiche und strategische Prioritäten. Wer Stellenausschreibungen über die Zeit verfolgt, kann Entwicklungen teilweise erkennen, bevor sie vom Unternehmen (wenn überhaupt) kommuniziert werden.

Auch der „Social-Proof-Mechanismus“ arbeitet für uns: Unternehmen präsentieren bereitwillig ihre Kunden und Partner, um Glaubwürdigkeit zu schaffen. Natürlich werden nicht zwangsläufig alle Kunden gezeigt und die Praxis variiert nach Branche, aber die relationalen Informationen, die hier sichtbar werden, sind oft sehr wertvoll.

Der ISTARI Ansatz: Vollumfassendes Lagebild durch Datenfusion

Ein Punkt, der oft übersehen wird, aber ganz pragmatisch für Unternehmenswebsites als Datenquelle spricht: Für die überwiegende Mehrheit der Unternehmen weltweit ist die eigene Webseite die einzige substanzielle öffentliche Informationsquelle. Social-Media-Profile können ergänzen, aber sie sind anders kuratiert: weniger strukturiert, weniger tiefgehend, stärker auf Engagement optimiert.

Und ja, es gibt Handelsregister und andere Pflichtpublikationen, aus denen Unternehmensinformationen ausgelesen werden können. Diese enthalten aber eigentlich immer nur die absoluten Basisdaten (Rechtsform, Geschäftsführer, Adresse). Nicht mehr. Auch andere traditionelle Unternehmensdatenbanken enthalten meist nur unzureichend detaillierte oder veraltete Informationen (lest dazu auch gerne meinen Blog zu obsoleten Branchencodes). Umfangreiche Geschäftsberichte wiederum sind fast ausschließlich nur für veröffentlichungspflichtige (börsennotierte) Unternehmen verfügbar.

Unternehmenswebsites sind also fast immer die primäre Quelle für detaillierte Produktinformationen, technische Dokumentationen, Geschäftsberichte (für nicht-börsennotierte Unternehmen), Pressemitteilungen und unternehmensbezogene News.

Wir bei ISTARI verlassen wir uns aber nicht ausschließlich auf Unternehmenswebseiten. Unser Agentensystem integriert systematisch weitere Quellen wie öffentliche Register, Patentdatenbanken, Nachrichtenportale und Branchenmagazine. Besonders interessant finde ich außerdem die Netzwerkperspektive: Wenn ein Unternehmen behauptet, Marktführer zu sein, können wir prüfen, ob es auf den Webseiten anderer Unternehmen als relevanter Akteur referenziert wird. Selbstdarstellung kann so häufig extern validiert werden.

Entdecken Sie die KI-Lösung, auf die führende Organisationen für verlässliche Markteinblicke vertrauen

Ersetzen Sie manuelle Analysen durch KI-gestützte Einblicke in die Unternehmen und Märkte, die Ihnen wichtig sind, basierend auf Daten, denen Sie vertrauen können. Bleiben Sie dem Markt immer einen Schritt voraus und treffen Sie smartere, schnellere Entscheidungen mit ISTARI.

Was die Forschung zeigt

Ein Aspekt, der mir als Wissenschaftler besonders wichtig ist: Wir haben unsere Daten wiederholt gegen etablierte Quellen und traditionelle Indikatoren validiert.

Im Rahmen unseres ISTARI Research Partner Programms arbeiten Forschungsgruppen renommierter Institutionen mit ISTARI-Daten, um unabhängige Studien durchzuführen. Diese Arbeiten vergleichen unsere webbasierten Indikatoren regelmäßig mit traditionellen Datenquellen wie Patentdaten, Registerdaten oder Umfrageergebnisse.

Das Ergebnis, das sich konsistent zeigt: Die Belastbarkeit von Webindikatoren ist hoch, und die Vorteile in Aktualität und Detailtiefe sind signifikant. Werft dazu auch gerne einen Blick in unser aktuelles Whitepaper.

Die  Grenzen von Webdaten – und wie wir damit umgehen

Ich will hier nicht den Eindruck erwecken, Webdaten wären perfekt. Das sind sie nicht. Die Qualität variiert. Manche Unternehmen pflegen ihre Webseite akribisch, andere nicht. Falschangaben sind möglich. Ein Unternehmen könnte theoretisch eine Zertifizierung angeben, die es nicht hat. Im ersten Schritt können wir das nicht widerlegen. Nicht alles wird kommuniziert. Unternehmen teilen, was ihnen nützt – nicht alles, was theoretisch für Außenstehende interessant wäre.

Mein Fazit zur Zuverlässigkeit von Webdaten

Unternehmenswebseiten sind eine zuverlässige Quelle für aktuelle Unternehmensinformationen – zuverlässiger, als viele zunächst annehmen. Das liegt nicht an besonderer Ehrlichkeit, sondern an ökonomischen Anreizen. Unternehmen profitieren davon, in bestimmten Bereichen transparent und aktuelle zu kommunizieren.

Die Kombination aus diesen intrinsischen Anreizen, systematischer Multi-Source-Validierung und wissenschaftlicher Überprüfung ergibt einen Ansatz, dem auch anspruchsvolle Anwender vertrauen, von Forschungsinstitutionen bis zu Ministerien.

Für uns bei ISTARI ist das nicht nur ein technisches Thema. Es ist die Grundlage dessen, was wir tun: Trusted Market Intelligence aus öffentlichen Daten zu generieren.

Jetzt kostenlos mit ISTARI Markets starten

Der schnellste Weg, relevante Unternehmen zu finden, zu filtern und zu verstehen.