Zaawansowane ustawienia

W niektórych dokumentach struktury tabel mogą być złożone - rozciągają się na kilka linii, zawierają zgrupowane informacje lub obejmują niepotrzebne dodatkowe wiersze. Zaawansowane ustawienia w trybie szkoleniowym pozwalają dostroić ekstrakcję tabel do takich przypadków, poprawiając dokładność i spójność.

Aby uzyskać dostęp do tych ustawień, aktywuj Tryb Szkoleniowy i kliknij ikonę zębatki Ustawienia na górnym pasku akcji:

Liczba Wierszy Nagłówka

Użyj tej opcji, aby zdefiniować, ile wierszy stanowi nagłówek tabeli.

Niektóre tabele mają nagłówki wieloliniowe. Na przykład nagłówek tej tabeli obejmuje dwie linie:

Ustaw Liczba wierszy nagłówka, aby dopasować:

Dlaczego to jest ważne?

Jeśli tego nie ustawisz, DocBits może traktować drugą linię jako dane, a nie jako część nagłówka, co prowadzi do błędów ekstrakcji:

Przed:

Po:

Przenieś Dodatkowe Wiersze do Kosza

Użyj tego, aby usunąć niechciane wpisy wieloliniowe, takie jak opisy przekraczające miejsce.

W tym przykładzie opis rozlewa się na kilka wierszy, ale istotna jest tylko pierwsza linia:

Włącz Przenieś Dodatkowe Wiersze do Kosza, aby usunąć nadmiar:

Wynik po mapowaniu:

Minimalna Liczba Zgrupowanych Wierszy

Użyj tego, gdy wiersze muszą być zgrupowane pod jednym głównym wierszem (np. pozycje z wieloma podwierszami).

Tutaj tylko trzy z sześciu wierszy są istotne. Dwa kluczowe kolumny są mapowane (np. Pozycja, Opis), podczas gdy inne traktowane są jako pola niestandardowe.

Zacznij od ustawienia Liczba wierszy nagłówka i Minimalna liczba zgrupowanych wierszy:

Włącz również Przenieś Dodatkowe Wiersze do Kosza, aby posprzątać zbędne dane:

Następnie zdefiniuj kolumnę klucza grupowania, np. Pozycja:

Wynik:

Odwrócone Grupowanie

Użyj tego, gdy wiersz grupujący pojawia się po wierszach, które powinien zgrupować.

Jeśli wiersz, który powinien być zgrupowany z innymi danymi, pojawia się powyżej klucza grupowania, włącz tę opcję:

Włącz Odwrócone grupowanie, zgrupuj według głównej kolumny (np. Kwota netto) i użyj Przenieś Dodatkowe Wiersze do Kosza, jeśli jest to konieczne:

Ostateczny wynik:

Podsumowanie

Użyj Zaawansowanych Ustawień, aby nauczyć DocBits, jak dokładnie obsługiwać bardziej złożone lub niekonsekwentne struktury tabel. Te ustawienia poprawiają precyzję ekstrakcji, uwzględniając:

  • Nagłówki wieloliniowe

  • Opisy wielowierszowe

  • Zgrupowane pozycje

  • Odwrócony porządek danych zgrupowanych

Włączenie tych opcji podczas szkolenia zapewnia, że DocBits zapamiętuje poprawny układ do przyszłych dokumentów od tego samego dostawcy.

Last updated

Was this helpful?