Numer: 03/2025 Str. 190
Autorzy: Mateusz Łępicki , Jarosław Kurek :
Tytuł: Efektywne wydobywanie informacji z CV przy użyciu małych modeli językowych SME w oparciu o podejście Zero-Shot Learning
Streszczenie: W dzisiejszym procesie rekrutacyjnym dokładne wyodrębnianie informacji z CV jest kluczowe. W niniejszym artykule analizujemy, w jaki sposób trzy małe modele językowe — Llama 2, Llama 3 i Phi-3 — mogą pomóc w tym zadaniu, korzystając z podejścia Zero-Shot. Sprawdziliśmy, jak dobrze te modele radzą sobie poprzez porównanie ich wyników z ręcznie stworzonym zbiorem danych, koncentrując się na dokładności oraz czasie potrzebnym na przetwarzanie danych na komputerach typowo używanych przez małe przedsiębiorstwa. Nasze testy wykazały, że nawet przy różnych zasadach dotyczących danych z CV w różnych krajach, te małe, lokalne modele działają dobrze i mogą być używane przez małe firmy na ich własnym sprzęcie. W naszych testach użyliśmy prostego promptu, a modele działały niezawodnie, potwierdzając swoją użyteczność w rzeczywistych sytuacjach związanych z rekrutacją. Wyniki pokazują, że małe modele językowe, takie jak Llama 2, Llama 3 i Phi-3, mogą dokładnie i efektywnie wyodrębniać informacje z CV, pomagając małym firmom w zarządzaniu danymi zgodnie z lokalnymi przepisami. To badanie podkreśla, w jaki sposób te modele mogą poprawić proces dopasowywania kandydatów do ofert pracy dla mniejszych firm.
Słowa kluczowe: ekstrakcja informacji, wstępnie trenowane modele NLP, małe modele LLM, proces rekrutacji, Zero-Shot Learning, przetwarzanie danych z CV, Llama 2, Llama 3, Phi-3, przetwarzanie języka naturalnego