Configurações Avançadas
Em alguns documentos, as estruturas de tabela podem ser complexas - abrangendo várias linhas, contendo informações agrupadas ou incluindo linhas extras desnecessárias. As Configurações Avançadas no modo de treinamento permitem ajustar a extração de tabelas para esses casos, melhorando a precisão e consistência.
Para acessar essas configurações, ative o Modo de Treinamento e clique no ícone de engrenagem Configurações na barra de ação superior:
Contagem de Linhas de Cabeçalho
Use essa configuração para definir quantas linhas compõem o cabeçalho da tabela.
Algumas tabelas têm cabeçalhos com várias linhas. Por exemplo, o cabeçalho desta tabela abrange duas linhas:
Defina a Contagem de linhas de cabeçalho para corresponder:
Por que isso é importante?
Se você não definir isso, o DocBits pode tratar a segunda linha como dados em vez de parte do cabeçalho, levando a erros de extração:
Antes:
Depois:
Mover Linhas Extras para o Lixo
Use isso para descartar entradas de várias linhas indesejadas, como descrições que transbordam.
Neste exemplo, a descrição se estende por várias linhas, mas apenas a primeira linha é relevante:
Habilite Mover Linhas Extras para o Lixo para remover o excesso:
Resultado após mapeamento:
Mínimo de Linhas Agrupadas
Use isso quando as linhas precisam ser agrupadas sob uma linha principal (por exemplo, itens de linha com várias sublinhas).
Aqui, apenas três de seis linhas são relevantes. Duas colunas principais são mapeadas (por exemplo, Posição, Descrição), enquanto outras são tratadas como campos personalizados.
Comece definindo a Contagem de linhas de cabeçalho e o Mínimo de linhas agrupadas:
Também habilite Mover Linhas Extras para o Lixo para limpar dados irrelevantes:

Em seguida, defina a coluna-chave de agrupamento, por exemplo, Posição:
Resultado:
Agrupamento Reverso
Use isso quando a linha de agrupamento aparece após as linhas que devem ser agrupadas.
Se a linha que deve ser agrupada com outros dados aparecer acima da chave de agrupamento, habilite esta opção:
Habilite Agrupamento Reverso, agrupe por uma coluna principal (por exemplo, Valor líquido) e use Mover Linhas Extras para o Lixo se necessário:
Resultado final:
Resumo
Use as Configurações Avançadas para ensinar ao DocBits como lidar com precisão estruturas de tabela mais complexas ou inconsistentes. Essas configurações melhoram a precisão da extração ao considerar:
Cabeçalhos de várias linhas
Descrições de várias linhas
Itens de linha agrupados
Ordem reversa de dados agrupados
Habilitar essas opções durante o treinamento garante que o DocBits lembre o layout correto para futuros documentos do mesmo fornecedor.
Last updated
Was this helpful?