Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Dokumentenuntertypen sind im Wesentlichen spezialisierte Versionen der Hauptdokumententypen. Zum Beispiel könnten unter dem Hauptdokumententyp "Rechnung" Untertypen wie "Standardrechnung", "Pro-forma-Rechnung" und "Gutschriftsrechnung" mit jeweils leicht unterschiedlichen Datenanforderungen oder Verarbeitungsregeln vorhanden sein.
Liste der Untertypen:
Jede Zeile repräsentiert einen Untertyp eines primären Dokumententyps.
Enthält den Namen des Untertyps und eine Reihe von Aktionen, die darauf ausgeführt werden können.
Aktionen:
Felder: Konfigurieren, welche Datenfelder im Untertyp enthalten sind und wie sie verwaltet werden.
Layout bearbeiten: Ändern Sie das visuelle Layout, wie Informationen für diesen Untertyp angezeigt und eingegeben werden.
Skripte: Anhängen oder bearbeiten Sie Skripte, die spezifische Operationen ausführen, wenn Dokumente dieses Untertyps verarbeitet werden.
Kopieren: Duplizieren Sie eine vorhandene Untertypkonfiguration, um sie als Grundlage für eine neue zu verwenden.
Löschen: Entfernen Sie den Untertyp, wenn er nicht mehr benötigt wird.
Hinzufügen neuer Untertypen:
Die Schaltfläche "+ Neu" ermöglicht es Administratoren, neue Untertypen zu erstellen, indem sie bei Bedarf eindeutige Eigenschaften und Regeln definieren.
Dokumentenuntertypen in DocBits bieten eine flexible und leistungsstarke Möglichkeit, eine Vielzahl von Dokumenten innerhalb eines einzigen Systems zu verarbeiten, um sicherzustellen, dass jeder Typ und Untertyp gemäß seinen einzigartigen Spezifikationen genau und effizient verarbeitet wird.
Der Layout-Manager ermöglicht es Administratoren, das Layout von Dokumententypen visuell zu konfigurieren und anzupassen, indem sie Eigenschaften für verschiedene Datenfelder und Gruppen innerhalb eines Dokuments festlegen. Diese Benutzeroberfläche hilft sicherzustellen, dass die Extraktionsmodelle und manuellen Dateneingabepunkte genau mit der Struktur des gescannten oder hochgeladenen Dokuments in DocBits übereinstimmen.
Gruppen und Felder:
Gruppen: Organisatorische Einheiten innerhalb eines Dokumententyps, die verwandte Felder kategorisieren (z. B. Rechnungsdetails, Zahlungsdetails). Diese können erweitert oder zusammengeklappt und so angeordnet werden, dass sie die logische Gruppierung im tatsächlichen Dokument widerspiegeln.
Felder: Einzelne Datenpunkte innerhalb jeder Gruppe (z. B. Rechnungsnummer, Zahlungsbedingungen). Jedes Feld kann angepasst werden, um festzulegen, wie Daten erfasst, angezeigt und verarbeitet werden.
Eigenschaften-Panel:
Dieses Panel zeigt die Eigenschaften des ausgewählten Feldes oder der Gruppe an und ermöglicht eine detaillierte Konfiguration, wie z. B.:
Beschriftung: Die sichtbare Beschriftung für das Feld in der Benutzeroberfläche.
Feldname: Der technische Bezeichner, der im System verwendet wird.
Elementbreite in Prozent: Bestimmt die Breite des Feldes im Verhältnis zum Dokumentenlayout.
Tab-Index: Steuert die Reihenfolge der Navigation per Tabulatortaste.
Skript bei Änderung ausführen: Ob ein Skript ausgeführt werden soll, wenn sich der Feldwert ändert.
Beschriftung links anzeigen: Ob die Beschriftung links vom Feld oder darüber angezeigt wird.
Ist Textbereich: Gibt an, ob das Feld ein Textbereich sein soll, der größere Textmengen aufnehmen kann.
Modelltyp auswählen: Option zur Auswahl des Modelltyps, der die Extraktion dieses Feldes durchführt.
Feldlänge: Maximale Länge der Daten, die in diesem Feld akzeptiert werden sollen.
Verbotene Schlüsselwörter: Schlüsselwörter, die im Feld nicht erlaubt sind.
Vorlagen-Vorschau:
Zeigt eine Echtzeitvorschau, wie das Dokument basierend auf der aktuellen Layoutkonfiguration aussehen wird. Dies hilft sicherzustellen, dass das Layout der tatsächlichen Dokumentenstruktur entspricht und ist entscheidend für das Testen und Verfeinern des Dokumentenverarbeitungs-Setups.
Die Felder-Einstellung bietet eine Benutzeroberfläche, über die Administratoren die Eigenschaften und das Verhalten einzelner Datenfelder verwalten können, die mit einem Dokumententyp verknüpft sind. Jedes Feld kann angepasst werden, um die Genauigkeit und Effizienz der Datenerfassung und -validierung zu optimieren.
Feldkonfiguration:
Feldnamen: Listet die Namen der Felder auf, die in der Regel den Datenelementen im Dokument entsprechen, wie z.B. "Rechnungsnummer" oder "Bestelldatum".
Erforderlich: Administratoren können Felder als erforderlich markieren, um sicherzustellen, dass Daten für diese Felder eingegeben oder erfasst werden müssen, um die Dokumentenverarbeitung abzuschließen.
Schreibgeschützt: Felder können auf schreibgeschützt gesetzt werden, um Änderungen nach der Datenerfassung oder während bestimmter Phasen der Dokumentenverarbeitung zu verhindern.
Versteckt: Felder können in der Benutzeroberfläche ausgeblendet werden, was für sensible Informationen oder zur Vereinfachung der Benutzerworkflows nützlich ist.
Erweiterte Einstellungen:
Validierung erzwingen: Stellt sicher, dass die in ein Feld eingegebenen Daten bestimmte Validierungsregeln bestehen, bevor sie akzeptiert werden.
OCR (Optische Zeichenerkennung): Dieser Schalter kann aktiviert werden, um die OCR-Verarbeitung für ein bestimmtes Feld zu ermöglichen, was für die automatisierte Datenauslese aus gescannten oder digitalen Dokumenten nützlich ist.
Übereinstimmungswert: Administratoren können einen Übereinstimmungswert definieren, eine Schwelle, die zur Bestimmung des Vertrauensniveaus der Datenerkennung oder -übereinstimmung verwendet wird und sich darauf auswirkt, wie Datenvalidierung und Qualitätsprüfungen durchgeführt werden.
Aktionsbuttons:
Neues Feld erstellen: Ermöglicht das Hinzufügen neuer Felder zum Dokumententyp.
Bearbeitungssymbole: Jedes Feld verfügt über ein Bearbeitungssymbol, das es Administratoren ermöglicht, feldspezifische Einstellungen wie Datentyp, Standardwerte oder verbundene Geschäftslogik weiter zu konfigurieren.
Einstellungen speichern: Übernimmt die vorgenommenen Änderungen an den Feldkonfigurationen.
Die Tabellenspalten-Schnittstelle in Docbits wird verwendet, um die Spalten festzulegen, die in Daten tabellen für jeden Dokumententyp angezeigt werden. Jede Spalte kann so konfiguriert werden, dass sie bestimmte Arten von Daten enthält, wie z. B. Zeichenfolgen oder numerische Werte, und kann für Sortier-, Filter- und Berichtsfunktionen innerhalb von Docbits unerlässlich sein.
Spaltenkonfiguration:
Spaltenname: Der Bezeichner für die Spalte in der Datenbank.
Titel: Der für den Benutzer lesbare Titel für die Spalte, der in der Benutzeroberfläche angezeigt wird.
Spaltentyp: Definiert den Datentyp der Spalte (z. B. STRING, BETRAG), der bestimmt, welche Art von Daten in der Spalte gespeichert werden können.
Tabellenname: Gibt an, zu welcher Tabelle die Spalte gehört, indem sie mit einem bestimmten Dokumententyp wie INVOICE_TABLE verknüpft wird.
Aktionen:
Bearbeiten: Ändern Sie die Einstellungen einer vorhandenen Spalte.
Löschen: Entfernen Sie die Spalte aus der Tabelle, was nützlich ist, wenn die Daten nicht mehr benötigt werden oder wenn sich die Datenstruktur des Dokumententyps ändert.
Hinzufügen neuer Spalten und Tabellen:
Neue Tabellenspalte hinzufügen: Öffnet einen Dialog, in dem Sie eine neue Spalte definieren können, einschließlich ihres Namens, ob sie erforderlich ist, ihres Datentyps und der Tabelle, zu der sie gehört.
Neue Tabelle erstellen: Ermöglicht die Erstellung einer neuen Tabelle, wobei ein eindeutiger Name definiert wird, der zur Speicherung von Daten im Zusammenhang mit einer bestimmten Gruppe von Dokumententypen verwendet wird.
Dieser Abschnitt ist entscheidend für die Aufrechterhaltung der strukturellen Integrität und Benutzerfreundlichkeit von Daten innerhalb des Docbits-Systems und stellt sicher, dass die aus Dokumenten extrahierten Daten auf organisierte und zugängliche Weise gespeichert werden.
Das Modelltraining ermöglicht es Administratoren, das Training von maschinellen Lernmodellen spezifisch für jeden Dokumententyp zu überwachen und zu verwalten. Indem Docbits eine strukturierte Benutzeroberfläche für den Import von Beispieldaten, das Training von Modellen und das Testen ihrer Leistung bereitstellt, stellt es sicher, dass seine Datenextraktionsfähigkeiten kontinuierlich verbessert werden.
Metrikenübersicht:
Beispiel: Anzahl der Beispieldokumente, die für das Training verwendet wurden.
Exportiert: Anzahl der Dokumente, die nach der Verarbeitung erfolgreich exportiert wurden.
Unternehmen Σ: Gesamtanzahl der unternehmensspezifischen verarbeiteten Dokumente.
Insgesamt Σ: Gesamtanzahl der verarbeiteten Dokumente in allen Kategorien.
Trainings- und Testoptionen:
Importieren: Ermöglicht es Administratoren, neue Trainingsdatensätze zu importieren, die in der Regel strukturierte Beispiele von Dokumenten sind, die vom System erkannt werden sollen.
Modell trainieren: Startet den Schulungsprozess unter Verwendung der importierten Daten, um die Erkennungs- und Extraktionsfähigkeiten des Systems zu verbessern.
Klassifizierung testen: Ermöglicht das Testen des Modells, um seine Leistung bei der Klassifizierung und Extraktion von Daten aus neuen oder unbekannten Dokumenten zu bewerten.
Aktionsbuttons:
Feld erstellen: Neue Datenfelder hinzufügen, die das Modell erkennen und extrahieren soll.
Aktionen: Dieses Dropdown-Menü kann Optionen wie Details anzeigen, Konfigurationen bearbeiten oder Trainingsdaten löschen enthalten.
In DocBits ermöglichen Regex-Einstellungen Administratoren, benutzerdefinierte Muster zu definieren, die vom System verwendet werden, um Daten aus Dokumenten zu finden und zu extrahieren. Diese Funktion ist besonders nützlich in Situationen, in denen Daten aus unstrukturiertem Text extrahiert werden müssen oder wenn die Daten einem vorhersehbaren Format folgen, das mit Regex-Mustern erfasst werden kann.
Regexes verwalten:
Hinzufügen: Ermöglicht das Erstellen eines neuen Regex-Musters für einen bestimmten Dokumententyp.
Änderungen speichern: Speichert Änderungen an vorhandenen Regex-Konfigurationen.
Muster: Hier können Sie das Regex-Muster definieren, das dem spezifischen erforderlichen Datenformat entspricht.
Ursprung: Ist der Dokumentenursprung - Zum Beispiel können Sie in Deutschland ein anderes Regex definieren
In DocBits bieten die EDI-Einstellungen Tools zur Definition und Verwaltung der Struktur und des Formats von EDI-Nachrichten, die verschiedenen Dokumententypen entsprechen, wie z. B. Rechnungen oder Bestellungen. Die Einstellungen ermöglichen die Anpassung von EDI-Nachrichten, um den Standards und Anforderungen verschiedener Handelspartner und Branchen zu entsprechen.
EDI-Konfigurationselemente:
Struktur-Deskriptor: Definiert die grundlegende Struktur des EDI-Dokuments, einschließlich Segmentreihenfolge, obligatorischer Felder und Qualifikatoren, die für die Gültigkeit des EDI-Dokuments erforderlich sind.
Transformation: Legt die Transformationen fest, die angewendet werden, um die Dokumentendaten in eine EDI-formatierte Nachricht umzuwandeln. Dies beinhaltet in der Regel die Festlegung von Zuordnungen von Dokumentfeldern zu EDI-Segmenten und Elementen.
Vorschau: Ermöglicht Administratoren, zu sehen, wie die EDI-Nachricht nach der Transformation aussehen wird, um die Genauigkeit vor der Übertragung sicherzustellen.
Extraktionspfade: Zeigt die Pfade, die zum Extrahieren von Werten aus dem Dokument verwendet werden, die dann zur Befüllung der EDI-Nachricht verwendet werden.
XSLT-Editor:
Wird zum Bearbeiten und Validieren der XSLT (eXtensible Stylesheet Language Transformations) verwendet, die im Transformationsprozess verwendet werden. XSLT ist eine leistungsstarke Sprache, die für die Transformation von XML-Dokumenten in andere XML-Dokumente oder andere Formate wie HTML, Text oder sogar andere XML-Strukturen entwickelt wurde.
Der Abschnitt Dokumententypen listet alle von Docbits erkannten und verarbeiteten Dokumententypen auf. Administratoren können verschiedene Aspekte wie Layout, Felddefinitionen, Extraktionsregeln und mehr für jeden Dokumententyp verwalten. Diese Anpassung ist entscheidend, um eine genaue Datenverarbeitung und die Einhaltung organisatorischer Standards sicherzustellen.
Liste der Dokumententypen:
Jede Zeile repräsentiert einen Dokumententyp wie Rechnung, Gutschrift, Lieferschein usw.
Dokumententypen können Standard- oder benutzerdefiniert sein, wie durch Bezeichnungen wie "Standard" angezeigt.
Layout bearbeiten: Diese Option ermöglicht es Administratoren, die Einstellungen des Dokumentenlayouts zu ändern, einschließlich der Definition, wie das Dokument erscheint und wo sich Datenfelder befinden.
Dokumentenuntertypen: Wenn Dokumententypen Unterkategorien haben, können Administratoren mit dieser Option Einstellungen konfigurieren, die spezifisch für jeden Untertyp sind.
Tabellenspalten: Passen Sie an, welche Datenspalten angezeigt werden sollen, wenn der Dokumententyp in Listen oder Berichten angezeigt wird.
Felder: Verwalten Sie die mit dem Dokumententyp verbundenen Datenfelder, einschließlich Hinzufügen neuer Felder oder Ändern vorhandener.
Modelltraining: Konfigurieren und trainieren Sie das Modell, das zur Erkennung und Extraktion von Daten aus den Dokumenten verwendet wird. Dies kann das Festlegen von Parametern für maschinelles Lernen umfassen, die sich im Laufe der Zeit mit mehr Daten verbessern.
Regex: Richten Sie reguläre Ausdrücke ein, die zur Extraktion von Daten aus Dokumenten basierend auf Mustern verwendet werden. Dies ist besonders nützlich für die Extraktion strukturierter Daten.
Skripte: Schreiben oder ändern Sie Skripte, die benutzerdefinierte Verarbeitungsregeln oder Workflows für Dokumente dieses Typs ausführen.
EDI (Electronic Data Interchange): Konfigurieren Sie Einstellungen im Zusammenhang mit dem Austausch von Dokumenten in standardisierten elektronischen Formaten.
Skripte in DocBits werden in der Regel in einer Skriptsprache geschrieben, die vom System Python unterstützt wird. Sie werden während des Dokumentenverarbeitungs-Workflows ausgelöst, um komplexe Geschäftslogik anzuwenden oder die Datenintegrität und -genauigkeit sicherzustellen, bevor die Daten weiterverarbeitet oder gespeichert werden.
Skriptverwaltung:
Name: Jedes Skript erhält einen eindeutigen Namen zur Identifizierung.
Dokumenttyp: Ordnet das Skript einem bestimmten Dokumenttyp zu, der bestimmt, auf welche Dokumente das Skript angewendet wird.
Auslösen bei: Definiert, wann das Skript ausgelöst wird (z. B. beim Hochladen von Dokumenten, vor dem Export von Daten, nach der Datenvalidierung).
Aktiver/Inaktiver Status: Ermöglicht Administratoren, Skripte zu aktivieren oder zu deaktivieren, ohne sie zu löschen, was Flexibilität bei Tests und Bereitstellung bietet.
Skript-Editor:
Bietet eine Benutzeroberfläche, in der Skripte geschrieben und bearbeitet werden können. Der Editor unterstützt in der Regel Syntaxhervorhebung, Fehlerhervorhebung und andere Funktionen zur Unterstützung bei der Skriptentwicklung.
Beispiel-Skript: Skripte können Operationen wie das Durchlaufen von Rechnungszeilen zur Validierung von Summen oder zum Entfernen von Einträgen, die bestimmte Kriterien nicht erfüllen, enthalten.