Im zweiten Teil dieser Serie wurde gezeigt, wie eine vollständige RAG-Pipeline auf Basis von PostgreSQL aufgebaut wird: Texte werden über ein lokales Embedding-Modell in Vektoren umgewandelt, mithilfe von pgvector in einer PostgreSQL-Datenbank gespeichert und semantisch durchsucht. Die Ergebnisse werden als Kontext an ein lokales LLM übergeben, das...
Im ersten Teil dieser Serie wurde erläutert, was pgvector ist, wie Embeddings entstehen und welche Distanzoperatoren für welche Anwendungsfälle geeignet sind. Dieser Beitrag schließt dort an und zeigt den vollständigen Weg von rohen Texten über die semantische Suche bis zur Antwort eines lokalen Sprachmodells. Das Beispiel basiert auf einem Reisean...
Viele Unternehmen stehen aktuell vor der Frage, wie sich Large Language Models sinnvoll in bestehende IT-Landschaften integrieren lassen, ohne dafür eine vollständig neue Infrastruktur und damit einhergehendes Wissen aufzubauen. Ein zentrales technisches Element moderner KI-Anwendungen ist dabei die Vektorsuche. Sie ermöglicht es, Daten nicht nach ...