Guias
Base de Conhecimento
2min
os dados de treinamento para grandes modelos de linguagem geralmente são baseados em dados públicos, e cada sessão de treinamento exige uma quantidade significativa de poder computacional isso significa que o conhecimento dos modelos geralmente não inclui conhecimento de domínios privados, e há um certo atraso no domínio do conhecimento público para resolver esse problema, a solução comum atual é usar a tecnologia rag (retrieval augmented generation), que utiliza as perguntas dos usuários para corresponder aos dados externos mais relevantes e, após recuperar o conteúdo relevante, reorganizar e inserir a resposta como contexto no prompt do modelo para saber mais, consulte a leitura estendida sobre retrieval augmented generation (rag) o recurso de base de conhecimento do paragraph visualiza cada etapa no pipeline rag, oferecendo uma interface de usuário simples e fácil de usar para ajudar os construtores de aplicações a gerenciar bases de conhecimento pessoais ou de equipe, e rapidamente integrá las em aplicações de ia você só precisa preparar o conteúdo de texto, como conteúdo de texto longo (arquivos txt, markdown, docx, html, jsonl, ou até mesmo pdfs) dados estruturados (csv, excel, etc ) além disso, estamos gradualmente suportando a sincronização de dados de várias fontes para os datasets, incluindo páginas web notion github bancos de dados cenário se sua empresa deseja estabelecer um assistente de atendimento ao cliente baseado na ia e na base de conhecimento existente, você pode carregar os documentos no dataset do paragraph e construir um chatbot no passado, isso poderia levar semanas e ser difícil de manter continuamente base de conhecimento e documentos no paragraph , conhecimento é uma coleção de documentos uma base de conhecimento pode ser integrada em uma aplicação como um contexto de recuperação documentos podem ser carregados por desenvolvedores ou por um membro da equipe de operações, ou sincronizados de outras fontes de dados (geralmente correspondendo a um arquivo unitário na fonte de dados)