Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
La section Types de documents répertorie tous les types de documents reconnus et traités par Docbits. Les administrateurs peuvent gérer divers aspects tels que la mise en page, les définitions de champs, les règles d'extraction, et plus encore pour chaque type de document. Cette personnalisation est essentielle pour garantir une manipulation précise des données et se conformer aux normes organisationnelles.
Liste des types de documents:
Chaque ligne représente un type de document tel que Facture, Note de crédit, Bon de livraison, etc.
Les types de documents peuvent être standard ou personnalisés, comme indiqué par des étiquettes telles que "Standard".
Modifier la mise en page: Cette option permet aux administrateurs de modifier les paramètres de mise en page du document, ce qui inclut la définition de l'apparence du document et l'emplacement des champs de données.
Sous-types de documents: Si certains types de documents ont des sous-catégories, cette option permet aux administrateurs de configurer des paramètres spécifiques à chaque sous-type.
Colonnes de tableau: Personnalisez les colonnes de données qui doivent apparaître lorsque le type de document est consulté dans des listes ou des rapports.
Champs: Gérez les champs de données associés au type de document, y compris l'ajout de nouveaux champs ou la modification de ceux existants.
Entraînement du modèle: Configurez et entraînez le modèle utilisé pour reconnaître et extraire des données des documents. Cela peut impliquer le paramétrage de modèles d'apprentissage automatique qui s'améliorent avec le temps et plus de données.
Regex: Configurez des expressions régulières utilisées pour extraire des données des documents en fonction de motifs. Cela est particulièrement utile pour l'extraction de données structurées.
Scripts: Écrivez ou modifiez des scripts qui exécutent des règles de traitement personnalisées ou des flux de travail pour les documents de ce type.
EDI (Échange de données informatisé): Configurez des paramètres liés à l'échange de documents dans des formats électroniques normalisés.
Le Gestionnaire de mise en page permet aux administrateurs de configurer visuellement et de modifier la mise en page des types de documents en définissant des propriétés pour divers champs de données et groupes au sein d'un document. Cette interface aide à garantir que les modèles d'extraction et les points de saisie manuelle de données s'alignent précisément sur la structure du document tel que numérisé ou téléchargé dans Docbits.
Groupes et Champs:
Groupes: Unités organisationnelles au sein d'un type de document qui catégorisent les champs associés (par exemple, Détails de la facture, Détails de paiement). Ils peuvent être développés ou réduits et disposés pour refléter le regroupement logique dans le document réel.
Champs: Points de données individuels au sein de chaque groupe (par exemple, Numéro de facture, Conditions de paiement). Chaque champ peut être personnalisé pour la capture, l'affichage et le traitement des données.
Panneau de propriétés:
Ce panneau affiche les propriétés du champ ou du groupe sélectionné, permettant une configuration détaillée, telle que:
Étiquette: L'étiquette visible pour le champ dans l'interface utilisateur.
Nom du champ: L'identifiant technique utilisé dans le système.
Largeur de l'élément en pourcentage: Détermine la largeur du champ par rapport à la mise en page du document.
Index de tabulation: Contrôle l'ordre de tabulation pour la navigation.
Exécuter un script en cas de modification: Indique si un script doit être exécuté lorsque la valeur du champ change.
Afficher l'étiquette à gauche: Indique si l'étiquette est affichée à gauche du champ ou au-dessus.
Est un champ de texte long: Spécifie si le champ doit être un champ de texte long, pouvant accueillir de plus grandes quantités de texte.
Sélectionner le type de modèle: Option pour sélectionner quel type de modèle gérera l'extraction de ce champ.
Longueur du champ: Longueur maximale des données à accepter dans ce champ.
Mots-clés interdits: Mots-clés qui ne sont pas autorisés dans le champ.
Aperçu du modèle:
Affiche un aperçu en temps réel de l'apparence du document en fonction de la configuration de mise en page actuelle. Cela aide à garantir que la mise en page correspond à la structure réelle du document et est essentiel pour tester et affiner la configuration de traitement du document.
Les types de documents sont essentiellement des versions spécialisées des principaux types de documents. Par exemple, sous le type de document principal "Facture", il peut y avoir des sous-types comme "Facture standard", "Facture pro forma" et "Avoir", chacun ayant des exigences de données ou des règles de traitement légèrement différentes.
Liste des sous-types:
Chaque ligne représente un sous-type d'un type de document principal.
Inclut le nom du sous-type et un ensemble d'actions pouvant être effectuées sur celui-ci.
Actions:
Champs: Configurez quels champs de données sont inclus dans le sous-type et comment ils sont gérés.
Modifier la mise en page: Modifiez la mise en page visuelle pour afficher et saisir les informations pour ce sous-type.
Scripts: Attachez ou modifiez des scripts qui exécutent des opérations spécifiques lorsque des documents de ce sous-type sont traités.
Copier: Dupliquez une configuration de sous-type existante pour l'utiliser comme base pour une nouvelle.
Supprimer: Supprimez le sous-type s'il n'est plus nécessaire.
Ajout de nouveaux sous-types:
Le bouton "+ Nouveau" permet aux administrateurs de créer de nouveaux sous-types, en définissant des propriétés et des règles uniques selon les besoins.
Les sous-types de documents dans Docbits offrent un moyen flexible et puissant de gérer une variété de documents au sein d'un seul système, garantissant que chaque type et sous-type est traité avec précision et efficacité selon ses spécifications uniques.
L'interface des Colonnes de Tableau dans Docbits est utilisée pour spécifier les colonnes qui apparaissent dans les tableaux de données pour chaque type de document. Chaque colonne peut être configurée pour contenir des types spécifiques de données, telles que des chaînes de caractères ou des valeurs numériques, et peut être essentielle pour les fonctions de tri, de filtrage et de reporting au sein de Docbits.
Configuration de la Colonne:
Nom de la Colonne: L'identifiant de la colonne dans la base de données.
Titre: Le titre lisible par l'homme de la colonne qui apparaîtra dans l'interface.
Type de Colonne: Définit le type de données de la colonne (par exemple, STRING, MONTANT), ce qui détermine le type de données pouvant être stockées dans la colonne.
Nom de la Table: Indique à quelle table appartient la colonne, la reliant à un type de document spécifique comme INVOICE_TABLE.
Actions:
Modifier: Modifier les paramètres d'une colonne existante.
Supprimer: Supprimer la colonne du tableau, ce qui est utile si les données ne sont plus nécessaires ou si la structure de données du type de document change.
Ajout de Nouvelles Colonnes et Tables:
Ajouter une Nouvelle Colonne de Table: Ouvre une boîte de dialogue où vous pouvez définir une nouvelle colonne, y compris son nom, si elle est requise, son type de données et la table à laquelle elle appartient.
Créer une Nouvelle Table: Permet la création d'une nouvelle table, en définissant un nom unique qui sera utilisé pour stocker des données liées à un ensemble spécifique de types de documents.
Cette section est essentielle pour maintenir l'intégrité structurelle et la facilité d'utilisation des données dans le système Docbits, en veillant à ce que les données extraites des documents soient stockées de manière bien organisée et accessible.
Le paramètre Champs fournit une interface utilisateur où les administrateurs peuvent gérer les propriétés et le comportement des champs de données individuels associés à un type de document. Chaque champ peut être ajusté pour optimiser la précision et l'efficacité de la capture et de la validation des données.
Configuration des Champs:
Noms des Champs: Liste les noms des champs, correspondant généralement aux éléments de données dans le document, tels que "Numéro de Facture" ou "Date de Commande".
Requis: Les administrateurs peuvent marquer les champs comme requis, s'assurant que des données doivent être saisies ou capturées pour que ces champs complètent le traitement du document.
Lecture Seule: Les champs peuvent être définis en lecture seule pour empêcher toute modification après la capture des données ou pendant certaines étapes du traitement du document.
Caché: Les champs peuvent être masqués dans l'interface utilisateur, utile pour les informations sensibles ou pour simplifier les flux de travail des utilisateurs.
Paramètres Avancés:
Forcer la Validation: Garantit que les données saisies dans un champ respectent certaines règles de validation avant d'être acceptées.
OCR (Reconnaissance Optique de Caractères): Ce commutateur peut être activé pour permettre le traitement OCR pour un champ spécifique, utile pour l'extraction automatique de données à partir de documents numérisés ou numériques.
Score de Correspondance: Les administrateurs peuvent définir un score de correspondance, un seuil utilisé pour déterminer le niveau de confiance de la reconnaissance ou de la correspondance des données, impactant la manière dont la validation des données et les contrôles de qualité sont effectués.
Boutons d'Action:
Créer un Nouveau Champ: Permet d'ajouter de nouveaux champs au type de document.
Icônes d'Édition: Chaque champ a une icône d'édition qui permet aux administrateurs de configurer davantage les paramètres spécifiques au champ, tels que le type de données, les valeurs par défaut ou la logique métier connectée.
Enregistrer les Paramètres: Valide les modifications apportées aux configurations des champs.
L'Entraînement du Modèle permet aux administrateurs de superviser et gérer la formation des modèles d'apprentissage automatique spécifiques à chaque type de document. En fournissant une interface structurée pour l'importation de données d'échantillons, la formation des modèles et le test de leurs performances, Docbits garantit que ses capacités d'extraction de données s'améliorent continuellement avec le temps.
Aperçu des Métriques:
Échantillon: Nombre de documents d'échantillons utilisés pour l'entraînement.
Exportés: Nombre de documents qui ont été exportés avec succès après traitement.
Entreprise Σ: Nombre total de documents spécifiques à l'entreprise traités.
Total Σ: Nombre total de documents traités dans toutes les catégories.
Options d'Entraînement et de Test:
Importation: Permet aux administrateurs d'importer de nouveaux ensembles de données d'entraînement qui sont généralement des échantillons structurés de documents devant être reconnus par le système.
Entraîner le Modèle: Lance le processus d'entraînement en utilisant les données importées pour améliorer les capacités de reconnaissance et d'extraction du système.
Test de Classification: Permet de tester le modèle pour évaluer sa performance dans la classification et l'extraction de données à partir de documents nouveaux ou non vus.
Boutons d'Action:
Créer un Champ: Ajoute de nouveaux champs de données que le modèle devrait reconnaître et extraire.
Actions: Ce menu déroulant peut inclure des options telles que voir les détails, modifier les configurations ou supprimer les données d'entraînement.
Les scripts dans Docbits sont généralement écrits dans un langage de script pris en charge par le système Python. Ils sont déclenchés pendant le flux de traitement des documents pour appliquer une logique métier complexe ou garantir l'intégrité et l'exactitude des données avant que les données ne soient traitées ou stockées davantage.
Gestion des Scripts:
Nom: Chaque script reçoit un nom unique pour l'identification.
Type de Document: Associe le script à un type de document spécifique, déterminant sur quels documents le script sera appliqué.
Déclenchement Sur: Définit quand le script est déclenché (par exemple, lors du téléchargement du document, avant l'exportation des données, après la validation des données).
Statut Actif/Inactif: Permet aux administrateurs d'activer ou de désactiver les scripts sans les supprimer, offrant ainsi une flexibilité dans les tests et le déploiement.
Éditeur de Script:
Fournit une interface où les scripts peuvent être écrits et édités. L'éditeur prend généralement en charge la coloration syntaxique, la mise en évidence des erreurs et d'autres fonctionnalités pour aider au développement du script.
Exemple de Script: Les scripts peuvent inclure des opérations telles que la boucle à travers les lignes de facture pour valider les totaux ou supprimer les entrées qui ne répondent pas à certains critères.
Dans Docbits, les paramètres Regex permettent aux administrateurs de définir des modèles personnalisés que le système utilise pour trouver et extraire des données à partir de documents. Cette fonctionnalité est particulièrement utile dans les situations où les données doivent être extraites à partir de texte non structuré ou lorsque les données suivent un format prévisible qui peut être capturé à l'aide de modèles regex.
Gestion des Regex:
Ajouter: Vous permet de créer un nouveau modèle regex pour un type de document spécifique.
Enregistrer les modifications: Enregistre les modifications apportées aux configurations regex existantes.
Modèle: Ici, vous pouvez définir le modèle regex qui correspond au format de données spécifique requis.
Origine: Est l'origine du document - Par exemple, vous pouvez définir un regex différent en Allemagne
Dans Docbits, les paramètres EDI fournissent des outils pour définir et gérer la structure et le format des messages EDI correspondant à divers types de documents, tels que les factures ou les bons de commande. Les paramètres permettent la personnalisation des messages EDI pour se conformer aux normes et aux exigences spécifiques des différents partenaires commerciaux et secteurs d'activité.
Éléments de Configuration EDI:
Descripteur de Structure: Définit la structure de base du document EDI, y compris l'ordre des segments, les champs obligatoires et les qualificateurs nécessaires pour que le document EDI soit valide.
Transformation: Spécifie les transformations appliquées pour convertir les données du document en un message formaté en EDI. Cela implique généralement de spécifier des correspondances entre les champs du document et les segments et éléments EDI.
Aperçu: Permet aux administrateurs de visualiser l'apparence du message EDI après transformation, aidant à garantir l'exactitude avant la transmission.
Chemins d'Extraction: Affiche les chemins utilisés pour extraire les valeurs du document, qui sont ensuite utilisées pour remplir le message EDI.
Éditeur XSLT:
Utilisé pour éditer et valider les XSLT (eXtensible Stylesheet Language Transformations) utilisés dans le processus de transformation. XSLT est un langage puissant conçu pour transformer des documents XML en d'autres documents XML ou d'autres formats tels que HTML, du texte, voire d'autres structures XML.