Zaawansowane ustawienia
W niektórych dokumentach struktury tabel mogą być złożone - rozciągają się na kilka linii, zawierają zgrupowane informacje lub obejmują niepotrzebne dodatkowe wiersze. Zaawansowane ustawienia w trybie szkoleniowym pozwalają dostroić ekstrakcję tabel do takich przypadków, poprawiając dokładność i spójność.
Aby uzyskać dostęp do tych ustawień, aktywuj Tryb Szkoleniowy i kliknij ikonę zębatki Ustawienia na górnym pasku akcji:
Liczba Wierszy Nagłówka
Użyj tej opcji, aby zdefiniować, ile wierszy stanowi nagłówek tabeli.
Niektóre tabele mają nagłówki wieloliniowe. Na przykład nagłówek tej tabeli obejmuje dwie linie:
Ustaw Liczba wierszy nagłówka, aby dopasować:
Dlaczego to jest ważne?
Jeśli tego nie ustawisz, DocBits może traktować drugą linię jako dane, a nie jako część nagłówka, co prowadzi do błędów ekstrakcji:
Przed:
Po:
Przenieś Dodatkowe Wiersze do Kosza
Użyj tego, aby usunąć niechciane wpisy wieloliniowe, takie jak opisy przekraczające miejsce.
W tym przykładzie opis rozlewa się na kilka wierszy, ale istotna jest tylko pierwsza linia:
Włącz Przenieś Dodatkowe Wiersze do Kosza, aby usunąć nadmiar:
Wynik po mapowaniu:
Minimalna Liczba Zgrupowanych Wierszy
Użyj tego, gdy wiersze muszą być zgrupowane pod jednym głównym wierszem (np. pozycje z wieloma podwierszami).
Tutaj tylko trzy z sześciu wierszy są istotne. Dwa kluczowe kolumny są mapowane (np. Pozycja, Opis), podczas gdy inne traktowane są jako pola niestandardowe.
Zacznij od ustawienia Liczba wierszy nagłówka i Minimalna liczba zgrupowanych wierszy:
Włącz również Przenieś Dodatkowe Wiersze do Kosza, aby posprzątać zbędne dane:

Następnie zdefiniuj kolumnę klucza grupowania, np. Pozycja:
Wynik:
Odwrócone Grupowanie
Użyj tego, gdy wiersz grupujący pojawia się po wierszach, które powinien zgrupować.
Jeśli wiersz, który powinien być zgrupowany z innymi danymi, pojawia się powyżej klucza grupowania, włącz tę opcję:
Włącz Odwrócone grupowanie, zgrupuj według głównej kolumny (np. Kwota netto) i użyj Przenieś Dodatkowe Wiersze do Kosza, jeśli jest to konieczne:
Ostateczny wynik:
Podsumowanie
Użyj Zaawansowanych Ustawień, aby nauczyć DocBits, jak dokładnie obsługiwać bardziej złożone lub niekonsekwentne struktury tabel. Te ustawienia poprawiają precyzję ekstrakcji, uwzględniając:
Nagłówki wieloliniowe
Opisy wielowierszowe
Zgrupowane pozycje
Odwrócony porządek danych zgrupowanych
Włączenie tych opcji podczas szkolenia zapewnia, że DocBits zapamiętuje poprawny układ do przyszłych dokumentów od tego samego dostawcy.
Last updated
Was this helpful?