Ce travail, se penché plus spécifiquement à la segmentation des chiffres manuscrits. Aussi, plusieurs méthodes ont été développées qui présentent chacune des avantages est des inconvénients.

Dans ce travail, nous proposons une nouvelle démarche de segmentation basée sur la combinaison de plusieurs méthodes de segmentation selon le type de configuration de chaînage entre chiffres.

Dans un système de reconnaissance numérique d’un chèque bancaire, la phase la plus importante réside dans la séparation des chiffres les uns des autres. Cette phase appelée segmentation reste cependant délicate à cause du chevauchement et/ou l’accolement de deux chiffres consécutifs. Pour résoudre ce problème, plusieurs méthodes de segmentation ont été développées qui présentent cependant chacune des avantages et des inconvénients.

A l’aide de quelques règles, nous définissons les chemins de segmentation afin de trouver le meilleur chemin de séparation des chiffres. Trois méthodes de segmentation ont été combinées fondées sur l’histogramme de projection, les contours et les points d’interconnexion. Cette démarche a été développée pour être intégrée dans un système de reconnaissance du montant numérique des chèques bancaires algériens.

Ce système est composé de quatre blocs : un bloc de prétraitement pour l’extraction de la zone d’intérêt, un bloc de segmentation, un bloc de normalisation des chiffres et un bloc de classification qui
permet d’affecter le chiffre à une classe prédéfinie. Les performances de notre stratégie ont été évaluées en termes de taux de bonne reconnaissance en utilisant la matrice de confusion.

Excerpt

Table des Matières

Chapitre 1: Reconnaissance de l’écriture Manuscrite

1.1. Introduction

1.2. Différents aspects de reconnaissance des chiffres manuscrits

1.2.1. Reconnaissance en-ligne et hors-ligne

1.2.1.1. Reconnaissance en-ligne (on-line)

1.2.1.2. Reconnaissance hors-ligne (off-line)

1.2.2. Reconnaissance des chiffres

1.3. Contraintes des systèmes de lecture

1.4. Organisation générale d’un système de reconnaissance hors ligne

1.4.1. Phase d’acquisition

1.4.2. Phase de prétraitements

1.4.3. Phase de segmentation :

1.4.4. Phase d’analyse

1.4.4.1. Normalisation

1.4.4.2. Squelettisation

1.4.4.3. Lissage

1.4.4.4. Extraction des caractéristiques

1.4.4.4.1 Les primitives structurelles

1.4.4.4.2 Les primitives statistiques

1.4.4.4.3 Les primitives globales

1.4.4.4.4 Les primitives topologiques ou métriques

1.4.5. Phase de classification

1.4.5.1. Approche statistique

1.4.5.2. Approche structurelle

1.4.5.3. Approche stochastique

1.4.6. Phase de post-traitement

1.5. Méthodes de classification

1.5.1. Réseaux de neurones

1.5.2. Support Vecteur Machine (Machines à Vecteurs de Support)

1.6. Conclusion

Chapitre 2: Méthodes de segmentation des chiffres manuscrits

2.1.Introduction

2.2. Segmentation primaire : Histogramme de projection

2.3.Segmentation secondaire

2.3.1. Problème de chevauchement de caractères

2.3.1.1 Corrections de pente et segmentation

2.3.1.2 Segmentation basé sur le contour

2.3.2. Problème des caractères connectés

2.3.2.1. Algorithme Drop Fall

2.3.2.2. Algorithme “water reservoir”

2.3.2.3. Algorithme basé sur les points interconnexion

2.3.3. Stratégie de combinaison

2.3.3.1. Motivation

2.3.3.2. Règles de combinaison

2.4. Conclusion

Chapitre 3: Réseaux de neurones

3.1. Introduction

3.2. Neurone formel

3.3. Perceptron monocouche

3.3.1. Architecture du perceptron

3.3.1. Apprentissage

3.4. Perception multicouches

3.4.1. Architecture du réseau

3.4.2. Phase d’apprentissage

3.5. Conclusion

Chapitre 4: Résultats expérimentaux

4.1. Introduction

4.2. complexité de la reconnaissance

4.3. Protocole expérimental

4.3.1. Présentation de la base des chèques

4.3.2. Démarche d’évaluation

4.3.3. Matrice de confusion

4.4. Prétraitements

4.4.1. Extraction de la zone d’intérêt

4.4.2. Problème de pixels parasites

4.4.3. Défaut d’encrage insuffisant

4.5. Evaluation manuelle

4.6. Evaluation du système

4.6.1. Description de la base

4.6.2. Normalisation

4.6.3. Dimensionnement du réseau

4.6.4. Evaluation

4.7. Conclusion

Objectif et Thématiques

L'objectif principal de ce travail est la conception d'un système de reconnaissance automatique pour les montants numériques des chèques bancaires algériens, en mettant un accent particulier sur la résolution des problèmes de segmentation des chiffres manuscrits chevauchés ou connectés.

Segmentation automatique de caractères manuscrits sur des documents financiers.
Combinaison de méthodes de segmentation (histogramme de projection, contours, points d'interconnexion).
Utilisation de réseaux de neurones pour la phase de classification des chiffres.
Gestion de la variabilité de l'écriture et des contraintes liées aux chèques bancaires algériens.
Évaluation des performances via la matrice de confusion et les taux de bonne reconnaissance.

Auszug aus dem Buch

2.3.2.1 Algorithme Drop Fall (Chute de la goutte)

Cette méthode de segmentation inspirée de l’algorithme “drop fall” consiste à segmenter la composante selon le chemin emprunté par une goutte d’eau qui coulerait selon le profile de la composante. Lorsque la goutte est bloquée au fond d’une vallée, celle-ci coupe la composante et continue sa chute. Cet algorithme permet de générer quatre chemins de coupures, suivant que la goutte descende ou qu’elle monte, et suivant la direction prioritaire (gauche ou droite) qu’on lui impose lorsqu’elle rencontre un extrema (mont ou vallée). Ces quatre variantes fournissent généralement des chemins différents contenant au moins une bonne segmentation (Figure2.6). Cet algorithme a été proposé pour la première fois par Congedo et al [16].

La mise en œuvre de l’algorithme Drop Fall implique généralement un ensemble de règles qui dictent le prochain pixel dans la voie de la chute de la goûte d’eau. Ces règles sont fondées sur la position actuelle du pixel pour trouver la voie de la chute de la goûte d’eau.

La combinaison des variantes de l’algorithme Drop Fall pourrait potentiellement conduire à une plus forte segmentation technique [23].

Résumé des chapitres

Chapitre 1: Reconnaissance de l’écriture Manuscrite: Ce chapitre présente les bases théoriques de la reconnaissance automatique et détaille les étapes standard du processus de traitement des chiffres manuscrits.

Chapitre 2: Méthodes de segmentation des chiffres manuscrits: Ce chapitre décrit différentes techniques de segmentation primaire et secondaire, tout en introduisant une nouvelle stratégie de combinaison pour optimiser la séparation des chiffres.

Chapitre 3: Réseaux de neurones: Ce chapitre traite des fondements des réseaux de neurones artificiels, de l'architecture du perceptron aux modèles multicouches et leurs méthodes d'apprentissage.

Chapitre 4: Résultats expérimentaux: Ce chapitre présente les tests réalisés sur une base de données de chèques réels et évalue l'efficacité de la stratégie de combinaison proposée par rapport aux méthodes classiques.

Mots-clés

Reconnaissance des chiffres manuscrits, segmentation des chiffres manuscrits, réseaux de neurones, chèques bancaires algériens, prétraitement, classification, histogramme de projection, points d'interconnexion, détection de contours, taux de bonne reconnaissance, matrice de confusion, apprentissage supervisé, normalisation, rétropropagation, seuillage.

Foire aux questions

Quel est l'objectif principal de cette recherche ?

Le travail vise à concevoir un système automatisé capable de lire les montants numériques manuscrits sur les chèques bancaires algériens, un processus rendu complexe par la connectivité et le chevauchement des chiffres.

Quelles sont les thématiques majeures abordées ?

La recherche se concentre sur les techniques de segmentation d'images numériques, les méthodes de prétraitement, et l'implémentation de réseaux de neurones pour la classification de chiffres.

Quelle est la contribution scientifique de ce mémoire ?

La contribution majeure est l'élaboration d'une stratégie de segmentation combinée qui sélectionne dynamiquement la meilleure méthode de séparation en fonction de la configuration des chiffres détectés.

Quelles méthodes de segmentation sont comparées ?

L'étude compare l'histogramme de projection verticale, la détection de contours, et les algorithmes basés sur les points d'interconnexion (Drop Fall et Water Reservoir).

Comment le système effectue-t-il la classification ?

La classification est réalisée par un perceptron multicouche (PMC) qui apprend à affecter chaque image de chiffre normalisée (16x16 pixels) à sa classe correspondante (de 0 à 9).

Quels sont les mots-clés qui caractérisent le mieux ce travail ?

Les mots-clés incluent la reconnaissance de chiffres manuscrits, les réseaux de neurones, la segmentation, la matrice de confusion et les chèques bancaires algériens.

Pourquoi la segmentation est-elle considérée comme l'étape la plus délicate ?

La segmentation est critique car une erreur à cette étape (chiffres mal séparés) conduit inévitablement à une erreur de classification par le réseau de neurones, compromettant la fiabilité globale du système.

Quel rôle jouent les points d'interconnexion dans la segmentation ?

Les points d'interconnexion (PI) et les points de base (PB) permettent à l'algorithme de détecter les zones où deux chiffres sont connectés ou se chevauchent, afin d'appliquer le chemin de coupure optimal.

Excerpt out of 88 pages - scroll top

Details

Title: Segmentation automatique pour la reconnaissance numérique des chèques bancaires Algériens
College: Abbes Laghrour University of Khenchela (Institut des Sciences et Technologie)
Author: Dr Abdeljalil Gattal (Author)
Publication Year: 2009
Pages: 88
Catalog Number: V454037
ISBN (eBook): 9783668875784
ISBN (Book): 9783668875791
Language: French
Tags: reconnaissance des chiffres manuscrits segmentation des chiffres manuscrits réseaux de neurones chèques bancaires algériens.
Product Safety: GRIN Publishing GmbH

Quote paper: Dr Abdeljalil Gattal (Author), 2009, Segmentation automatique pour la reconnaissance numérique des chèques bancaires Algériens, Munich, GRIN Verlag, https://www.grin.com/document/454037

Segmentation automatique pour la reconnaissance numérique des chèques bancaires Algériens