Wie wir das Problem der Zuordnung von Stellenangeboten und Lebensläufen ohne Speicherung überflüssiger Daten gelöst haben

Wir haben einen Ansatz entwickelt, der es ermöglicht, Stellenangebote und Lebensläufe zu vergleichen und dabei das Volumen der gespeicherten Daten zu minimieren.

13 Jun 2026

---

Einführung in das Problem der Personalbeschaffung ohne Datenspeicherung

Kürzlich entbrannte in Slack eine Diskussion darüber, wie man Stellenangebote und Lebensläufe besser zuordnen kann, ohne überflüssige Datenbanken zu erstellen. Einer der Entwickler stellte die Frage: Wie können wir nur die notwendigen Daten speichern und gleichzeitig eine qualitativ hochwertige Übereinstimmung gewährleisten? Dies stellte für uns eine Herausforderung dar, da die Effizienz unseres Personalvermittlungsdienstes davon abhing.

Kontext der Aufgabe

Das Problem, mit dem wir konfrontiert waren, entstand durch die Erweiterung unserer Plattform. Recruiter und Kandidaten begannen zu bemerken, dass die Suchergebnisse für Stellenangebote und Lebensläufe nicht immer übereinstimmten. Wir waren uns bewusst, dass dies unsere Reputation auf dem Markt beeinträchtigen konnte. Wenn wir keine qualitativ hochwertigen Ergebnisse liefern können, riskieren wir, das Vertrauen unserer Nutzer zu verlieren, besonders in einem wettbewerbsintensiven Umfeld.

Konkrete Schwierigkeiten

Ein Beispiel, das wir untersucht haben, war die Zuordnung von Lebensläufen, bei denen Schlüsselwörter nicht immer zwischen Stellenangeboten und Kandidaten übereinstimmten. Zum Beispiel konnte der Lebenslauf eines Kandidaten den Begriff „Softwareentwicklung“ enthalten, während das Stellenangebot „Programmierung“ verlangte. Diese Unterschiede beeinflussten die Suchergebnisse und damit die Zufriedenheit der Nutzer. Wir erkannten, dass wir einen flexibleren und intelligenten Ansatz zur Datenverarbeitung finden mussten.

Erste Lösungsversuche

Die erste Lösung, die wir ausprobierten, war die Verwendung einfacher Schlüsselwortalgorithmen. Wir entwickelten ein System, das Stellenangebote und Lebensläufe basierend auf der Häufigkeit von Wörtern zuordnete. Dieses Vorgehen erwies sich jedoch als ineffektiv. Bei Tests stellten wir fest, dass viele geeignete Kandidaten Stellenangebote aufgrund von Terminologieunterschieden nicht fanden. Dies war für uns ein Signal, dass wir eine tiefere Analyse benötigen.

Technischer Ansatz zur Lösung

Letztendlich entschieden wir uns, einen komplexeren Algorithmus für maschinelles Lernen zu verwenden, der den Kontext von Wörtern und deren Semantik berücksichtigte. Wir implementierten ein Modell, das auf einem Datensatz trainiert wurde, der verschiedene Stellenangebote und Lebensläufe enthielt. Ein Beispielcode, der die Schlüsselpunkte der Implementierung veranschaulicht:

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

vectorizer = TfidfVectorizer()
vacancy_matrix = vectorizer.fit_transform(vacancies)
candidate_matrix = vectorizer.transform(candidates)

similarity = cosine_similarity(vacancy_matrix, candidate_matrix)

Dieser Ansatz ermöglichte es uns, Stellenangebote und Lebensläufe genauer zuzuordnen, während wir das Volumen der Daten, die wir speichern mussten, minimierten. Wir konnten nur „komprimierte“ Darstellungen von Stellenangeboten und Lebensläufen speichern, was die Belastung unserer Datenbank erheblich reduzierte.

Änderungen im Produkt

Nach der Einführung des neuen Algorithmus bemerkten wir eine signifikante Verbesserung der Qualität der Suchergebnisse. Kandidaten erhielten mehr relevante Angebote, und Recruiter berichteten von einer höheren Qualität bei der Auswahl. Dies hatte sich positiv auf das Nutzererlebnis ausgewirkt, was sich wiederum in den Kennzahlen im Bereich /jobs und /for-companies widerspiegelte. Wir sind überzeugt, dass diese Änderungen uns helfen werden, unsere Marktposition zu stärken.

Lektionen, die wir gelernt haben

Die Verwendung einfacher Algorithmen kann zu unzureichender Effizienz führen.
Kontextuelle Semantik ist wichtiger als die Häufigkeit von Wörtern.
Datenkompression ermöglicht die Senkung der Speicherkosten.
Nutzerfeedback ist ein wichtiger Faktor zur Verbesserung des Produkts.
Scheuen Sie sich nicht, verschiedene Ansätze auszuprobieren: Manchmal kann die beste Lösung unerwartet sein.

Bedeutung für Kandidaten

Kandidaten können nun mit genaueren und relevanteren Angeboten rechnen. Dank des verbesserten Algorithmus steigen ihre Chancen, von Recruitern wahrgenommen zu werden, was den Prozess der Jobsuche effizienter und angenehmer macht.

Bedeutung für Recruiter

Recruiter erhalten Zugang zu qualitativ hochwertigeren Kandidaten, was die Zeit, die sie mit der Suche verbringen, minimiert. Das verbesserte Zuordnungssystem ermöglicht es ihnen, schneller passende Lebensläufe zu finden, was die Gesamtproduktivität steigert.

Nächste Schritte

Trotz der erzielten Fortschritte beobachten wir weiterhin die Ergebnisse des neuen Algorithmus. Wir planen, zusätzliche Experimente durchzuführen, um zu verstehen, wie wir die Qualität der Zuordnung weiter verbessern können, ohne das Volumen der gespeicherten Daten zu erhöhen. Wenn wir von vorne anfangen müssten, würden wir in den frühen Entwicklungsphasen mehr Wert auf Nutzerfeedback legen, um einige frühere Fehler zu vermeiden. ---

Auch auf Fitlane AI

Themen: сравнение вакансий и резюме, хранение данных, оптимизация процессов, машинное обучение, алгоритмы сопоставления, Fitlane AI, платформа для подбора кадров

Alle Artikel