Guias
Base de Conhecimento
Manutenção de Base de Conhecimento e Documentos
12min
visualizando segmentos de texto cada documento carregado na base de conhecimento é armazenado na forma de segmentos de texto (chunks) você pode visualizar o conteúdo específico de cada segmento na lista de segmentos verificando a qualidade dos segmentos a qualidade da segmentação dos documentos afeta significativamente o desempenho de perguntas e respostas (q\&a) da aplicação da base de conhecimento recomenda se verificar manualmente a qualidade dos segmentos antes de associar a base de conhecimento à aplicação embora métodos de segmentação automática baseados no comprimento de caracteres, identificadores ou segmentação semântica de nlp possam reduzir significativamente a carga de trabalho de segmentação de grandes volumes de texto, a qualidade da segmentação está relacionada à estrutura do texto em diferentes formatos de documentos e ao contexto semântico a verificação e correção manual podem efetivamente compensar as deficiências da segmentação automática no reconhecimento semântico ao verificar a qualidade dos segmentos, preste atenção às seguintes situações segmentos de texto muito curtos, levando à perda de semântica; segmentos de texto muito longos, causando ruído semântico que afeta a precisão da correspondência; truncamento semântico evidente, que ocorre ao usar limites de comprimento máximo de segmento, resultando em truncamento forçado e perda de conteúdo durante a recuperação; adicionando segmentos de texto na lista de segmentos, clique em "adicionar segmento" para adicionar um ou mais segmentos personalizados ao documento adicionar um chunk ao adicionar segmentos em massa, é necessário primeiro baixar o modelo de upload de segmentos em formato csv, editar todo o conteúdo dos segmentos no excel de acordo com o formato do modelo, salvar o arquivo csv e, em seguida, carregá lo editando segmentos de texto na lista de segmentos, você pode editar diretamente o conteúdo dos segmentos adicionados, incluindo o conteúdo do texto e as palavras chave dos segmentos gerenciamento de metadados além de marcar informações de metadados de documentos de diferentes fontes, como o título, url, palavras chave e descrição de dados da web, os metadados serão utilizados no processo de recuperação de segmentos da base de conhecimento como campos estruturados para filtragem de recuperação ou exibição de fontes de citação as funções de filtragem de metadados e de fonte de citação ainda não são suportadas na versão atual adicionando documentos em "base de conhecimento > lista de documentos", clique em "adicionar arquivo" para carregar novos documentos ou páginas do notion para a base de conhecimento criada uma base de conhecimento (knowledge) é uma coleção de documentos (documents) os documentos podem ser carregados por desenvolvedores ou operadores, ou sincronizados de outras fontes de dados (geralmente correspondendo a uma unidade de arquivo na fonte de dados) desativação e arquivamento de documentos desativar o dataset suporta a desativação de documentos ou segmentos que não devem ser indexados temporariamente na lista de documentos do dataset, clique no botão de desativar para desativar o documento você também pode desativar um documento inteiro ou um segmento específico nos detalhes do documento documentos desativados não serão indexados clique em ativar nos documentos desativados para cancelar o status de desativação arquivar dados de documentos antigos que não estão mais em uso podem ser arquivados se você não quiser excluí los dados arquivados podem apenas ser visualizados ou excluídos, não podem ser editados na lista de documentos do dataset, clique no botão de arquivar para arquivar o documento você também pode arquivar documentos nos detalhes do documento documentos arquivados não serão indexados documentos arquivados também podem ser desarquivados configurações da base de conhecimento clique em configurações na navegação à esquerda da base de conhecimento para alterar as seguintes configurações nome da base de conhecimento defina um nome para identificar uma base de conhecimento descrição da base de conhecimento usada para descrever as informações representadas pelos documentos na base de conhecimento quando o modo de recuperação da base de conhecimento é n para 1, a base de conhecimento é fornecida como uma ferramenta para chamadas de raciocínio de llm o raciocínio é baseado na descrição da base de conhecimento se a descrição estiver vazia, a estratégia de indexação automática do paragraph será usada permissões de visibilidade você pode escolher "apenas eu" ou "todos os membros da equipe" pessoas sem permissões não poderão visualizar e editar o dataset modelo de embedding modifique o modelo de embedding da base de conhecimento alterar o modelo de embedding reembutirá todos os documentos na base de conhecimento, e os embeddings originais serão excluídos gerenciamento da api da base de conhecimento a base de conhecimento do paragraph fornece um conjunto completo de apis padrão desenvolvedores podem usar chamadas de api para realizar operações de gerenciamento e manutenção diárias, como adicionar, excluir, modificar e consultar documentos e segmentos na base de conhecimento