Analyse des sons auscultatoires pulmonaires

1. Introduction

Savoir distinguer les sons pulmonaires normaux et anormaux (sibilants, crépitants, etc ...) est important pour le diagnostic médical. En effet, les sons respiratoires contiennent de précieuses informations sur la physiologie et les pathologies des poumons et des voies aériennes.
On verra plus loin que le phonopneumogramme et le spectrogramme d'un son enregistré à l'aide d'un stéthoscope électronique peuvent aider à déterminer l’état du parenchyme pulmonaire, ainsi que les modification pathologiques des voies aériennes.
Parmi les marqueurs connus (sibilants, crépitants, stridors, ronchis), les travaux publiés se concentrent principalement sur la détection des crépitants et des sibilants.

Cet article, que nous avons rédigé fin 2006, fait un état des lieux des publications disponibles à cette date, et des travaux de recherche relatifs à l’auscultation pulmonaire et surtout aux méthodes d’analyse des sons auscultatoires pulmonaires.

2. Limites de l’audition humaine

Des études ont été réalisées pour tester la capacité de l’oreille humaine à détecter les crépitants dans un signal auscultatoire. La méthode utilisée consistait à superposer des crépitants artificiels à un signal réel. Les résultats indiquent que les erreurs de détections les plus significatives sont liées aux facteurs suivants:

• l’intensité du signal respiratoire : les respirations amples masquent d’avantage les crépitants que les respirations superficielles;

• le type de crépitants : les crépitants fins sont plus facilement reconnaissables car leur forme d’onde diffère d’avantage de celle des sons pulmonaires classiques;

• l’amplitude des crépitants. On conclue de ces études que la validation des algorithmes de détection automatique de crépitants ne devrait pas se reposer sur l’auscultation comme unique référence.

2.1. Intérêt de l’analyse automatique des sons

À l’inverse, la compréhension des mécanismes sous-jacents à la production des sons pulmonaires est encore très imparfaite, et l’enregistrement, puis l’analyse des sons respiratoires permet d’améliorer cette compréhension ainsi qu’une mise en relation objective des sons respiratoires anormaux avec une pathologie respiratoire particulière.
Par ailleurs, une analyse objective permet le développement de systèmes de classification qui rendent possible une qualification plus précise des sons respiratoires normaux et des sons pathologiques.
Alors que l’auscultation conventionnelle au stéthoscope est subjective et difficilement partageable, ces systèmes devraient apporter une aide au diagnostic objective et précoce avec une meilleure sensibilité et reproductibilité des résultats.
De plus, les applications, y compris l’évaluation du diagnostic, le monitoring et l’échange de données par Internet sont des compléments évidents de l’analyse objective et automatique des sons auscultatoires. Les outils de capture permettent le monitoring longue durée des patients à l’hôpital ou à domicile. Elle pourrait également être une solution utile pour les pays en voie de développement ou les communautés reculées. Ce type de système a, de plus, l’immense avantage de conserver le caractère non invasif et peu coûteux de l’auscultation. Enfin, l’étude de Sestini et al. montre qu’une association entre le signal acoustique et l’image est utile pour l’apprentissage et la compréhension des sons pulmonaires par les étudiants en médecine.

2.2. Propagation des sons pulmonaires

La propagation et la déformation des sons pulmonaires sont liées à différents facteurs:

• la réponse acoustique du stéthoscope, l’asymétrie des sons (qui indique la présence d’une éventuelle anomalie ou pathologie), la composition hétérogène des tissus (os, muscles, peau. . .) qui agissent comme des filtres ;

• le point d’analyse : les mesures indiquent que les sons thoraciques sont plus faibles en amplitude que les sons trachéaux.

2.3. Définition des marqueurs connus
Il existe aujourd’hui de nombreuses définitions différentes des caractéristiques de marqueurs communs tels que le sibilant ou le crépitant.
Une sémantique universelle reste à créer.
Divers travaux ont essayé de collecter les définitions des termes liés aux sons respiratoires et ont abouti au recensement de 162 termes utilisés couramment dans le Computer respiratory sound analysis (CORSA). Cela ne permet cependant pas aux médecins d’avoir une définition commune des termes employés et de ce fait, la description des caractéristiques des sons est encore très imagée. à titre d’illustration, un sibilant est encore très souvent associé à « un bruit sifflant » et un crépitant à « un bruit de grain de riz dans une poêle ».
Et la définition objective (amplitude, gradient, fréquence, durée) est différente pour chaque auteur. Il existe aujourd’hui de nombreuses définitions différentes des caractéristiques de marqueurs communs tels que le sibilant ou le crépitant.
Et la définition objective (amplitude, gradient, fréquence, durée) est différente pour chaque auteur.

2.4. Définition d’une sémiologie

L’article de Rossi et al. fournit des recommandations relatives aux conditions expérimentales nécessaires à l’enregistrement de sons respiratoires.
Il définit les conditions expérimentales optimales (relatives notamment au bruit ambiant, y compris les sons non respiratoires du sujet, tels que les sons vocaux) ainsi que les procédures spécifiques au type de son que l’on désire enregistrer (souffles, toux, ronflements), des indications pour l’enregistrement (diagnostic, évaluation d’une thérapie, monitoring), de l’âge du sujet (bébé, enfant, adulte), et de la méthode d’enregistrement (champ libre, microphone endobronchial).
L’auteur s’appuie sur les mêmes recommandations que celles de l’European Respiratory Society(ERS) pour les tests des fonctions pulmonaires pour la préparation du sujet. Pour les enregistrements courts, une position assise est conseillée, alors qu’une position couchée est généralement préférable pour des enregistrements longs.

3. Définition des termes
L’article de Sovijari et al. publié dans l’European Respiratory Journal fournit des définitions précises pour les termes couramment utilisés dans le domaine de l’auscultation pulmonaire et de l’analyse des sons. Les plus pertinentes sont rappelées ci-dessous.

3.1. Sons pulmonaires

• sons respiratoires (breath sound): l'ensemble des sons, normaux et pathologiques enregistrés au niveau de la trachée, des poumons ou de la bouche. Leur génération est liée au flux d’air dans le système respiratoire. Ils sont caractérisés par un large spectre sonore, avec une fréquence moyenne dépendant du point d’auscultation;

• sons pathologiques (adventitious sound) : il s’agit de sons respiratoires additionnels, rajoutés aux sons respiratoires normaux. Ils peuvent être continus (sibilants) ou discontinus (crépitants). Certains (comme les squawks) possèdent des caractéristiques des deux. La présence de tels sons est a priori un indicateur de désordres pulmonaires;

• son bronchique (bronchial sound): ce terme est utilisé dans deux acceptions ; il couvre à la fois les sons respiratoires normaux qui sont détectés dans la partie antérieure haute des poumons et dont l’intensité est à peu près identique durant les phases d’inspiration et d’expiration, mais aussi des sons respiratoires anormaux qui sont détectés dans la partie postérieure des poumons et qui contiennent des composantes de haute fréquence et une intensité plus élevée que les sons respiratoires normaux enregistrés au même point. Le passage de son normal à son pathologique est dû à des désordres pulmonaires;

• sons pulmonaires (lung sound): il s’agit de tous les sons enregistrés au niveau du thorax. Ils incluent les sons respiratoires normaux et les sons pathologiques;

• sons musculaires (muscle sound): il s’agit de sons générés par la contraction musculaire. Ils ont généralement une fréquence faible (inférieure à 20 Hz) et une faible intensité. L’amplitude et la fréquence des sons musculaires sont liées à la force de contraction;

• son respiratoire normal (normal breath sound): sur le thorax, un son respiratoire normal est caractérisé par un bruit faible pendant l’inspiration, et très audible pendant l’expiration. Au niveau de la trachée, le son respiratoire normal est caractérisé par un large spectre de bruit (par exemple: contenant des composantes haute-fréquence), audible à la fois durant la phase d’inspiration et celle d’expiration;

• son pleural de friction (pleural friction sound): ces bruits forts résultent du frottement pleuropariétal et viscéral. Leur présence est le signe d’une inflammation, voire d’un liquide au niveau pleural.

3.2. Marqueurs pathologiques

• crépitants (crackles): ces sons pathologiques, discontinus, explosifs apparaissent généralement dans la phase d’inspiration. Ils sont caractérisés par leur forme d’onde, leur durée et leur position dans le cycle respiratoire. Un crépitant peut être caractérisé par sa durée totale comme étant un crépitant fin (si sa durée est courte) ou gros (si sa durée est longue). L’apparition de crépitants révèle généralement des pathologies du tissu pulmonaire, voire des voies de conduction;

• gros crépitant (coarse crackle): crépitant avec un timbre plus grave, une forte amplitude et une longue durée. 2CD supérieur à 10ms (CD: durée de deux cycles);

• crépitant fin (fine crackle): crépitant avec un timbre plus aigu, une faible amplitude et une courte durée. 2CD inférieur à 10ms;

• toux (cough): il s’agit d’un réflexe respiratoire caractérisé par une soudaine expulsion d’air d’une grande vélocité, accompagné de sons transitoires de timbre et d’intensité variable. La toux est causée par une irritation des voies de conduction. Une simple toux consiste en une phase inspiratoire suivie d’un effort expiratoire avec fermeture de la glotte; cette phase est suivie d’une soudaine réouverture de la glotte avec une rapide expiration du flux d’air. Une toux chronique indique généralement la présence d’une pathologie des voies respiratoires ou des désordres du tissu pulmonaire;

• sons de toux (cough sound): les sons transitoires induits par les réflexes de toux ont une fréquence comprise entre 50 et 3000 Hz. Les caractéristiques de ces sons varient en fonction de la pathologie pulmonaire. Ainsi, les sons de toux qui contiennent des sibilants sont typiquement des cas d’asthme;

• ronchis (rhonchus): il s’agit d’un sibilant au timbre plus grave, contenant des formes d’ondes périodiques avec une durée supérieure à 100 ms et une fréquence inférieure à 300 Hz. Les ronchis traduisent la présence de sécrétions ou des rétrécissements des voies aériennes;

• ronflements (snoring sound): il s’agit de bruits respiratoires de basse fréquence avec des composantes périodiques (fréquence fondamentale entre 30 et 250 Hz) qui se produisent pendant la phase de sommeil, et sont induit par les vibrations anormales dans les parois ou l’oropharynx. Ils sont le plus souvent inspiratoires ; de faibles composantes expiratoires peuvent apparaître chez les patients atteints d’apnée obstructive du sommeil;

• squawk (squawk): il s’agit de sons inspiratoires pathologiques relativement courts, et qui présentent un caractère musical. Ils sont occasionnellement trouvés chez les patients atteints de désordres pulmonaires interstitiels. Acoustiquement, leur forme d’onde ressemble à de courts sibilants, ils sont souvent précédés de crépitants. La durée des squawks varie entre 50 et 400 ms;

• stridor (stridor): c’est un son fort, de basse fréquence, qui trouve son origine dans le larynx ou dans la trachée. Il apparaît souvent durant l’inspiration. Il peut être audible au niveau de la bouche, de la trachée et des poumons. Les stridors peuvent apparaître dans les toux asphyxiantes (vibration des structures laryngées lors de dyspnée) ou les sténoses laryngales ou trachéales;

• sibilant (wheeze): ce son pathologique, continu, présente un caractère musical. Acoustiquement, il est caractérisé par une forme d’onde avec une fréquence dominante généralement supérieure à 100 Hz et une durée supérieure à 100 ms. De plus, le son doit inclure au moins dix vibrations successives. Les sibilants sont généralement associés à l’obstruction des voies aériennes. Le sibilant est qualifié de monophonique s’il n’a qu’une fréquence. S’il en contient plusieurs fréquences, on le qualifie de polyphonique.3.3. Méthodes de visualisation

• phonopneumogramme (phonopneumogram): il s’agit de la représentation de l'amplitude du signal d'auscultation en fonction du temps; la figure ci-dessous représente un phonopneumogramme prélevé à l'aide d'un prototype Alcatel-Lucent de stéthoscope et généré par le logiciel propriétaire de la société. La courbe verte est le résultat de notre algorithme de détection des phases de respiration (inspiration, apnée, expiration, apnée).

• spectrogramme (spectrogram): il s’agit d’une représentation dans laquelle le temps figure en abscisse, la fréquence en ordonnée et l’intensité du signal est représentée par une palette de couleurs; la figure ci-dessous représente un spectrogramme prélevé à l'aide d'un prototype Alcatel-Lucent de stéthoscope et généré par le logiciel propriétaire de la société. le spectrogramme, c'est la courbe du haut, que j'ai placé en regard du phonopneumogramme précédent. Il s'agit du même enregistrement pulmonaire d'un individu sain. Le choix des couleurs peut être configuré. Sur cet exemple, on va du bleu foncé (aucune énergie) au rouge (énergie maximale) en passant par le jaune.

4. Techniques de capture

Enregistrer le son de manière adaptée est une étape importante qui précède la phase d’analyse du signal. Typiquement la chaîne de capture du son comprend les éléments suivants:
• capture du son : le positionnement du microphone est important; en effet la cage thoracique agit comme un atténuateur et un filtre passe-bas;
• amplification du signal;
• filtrage, échantillonnage, numérisation, codage;
• réduction des bruits (bruit cardiaque, frottement de la membrane, bruit ambiant);
• enregistrement du son documenté.
L’article de Cheetham et al. rappelle ces points importants, relatifs à la numérisation des enregistrements des sons auscultatoires.

4.1. Acquisition
Il existe différentes méthodes et outils de capture du son.

• utilisation d’un seul micro: il s’agit de la méthode la plus couramment utilisée. Le capteur est généralement un micro électret, la fréquence d’échantillonnage est le plus souvent celle qui est utilisée pour les codecs pour la téléphonie (8 kHz). Vient ensuite une conversion analogique/numérique avec une résolution de 16 bits. D’aucuns utilisent un accéléromètre, moins sensible au bruit ambiant, mais moins performant que le microélectret;

• utilisation de plusieurs microphones et représentation 3D: cette technique permet l’identification des zones à l’origine des sons. Il s’agit d’une méthode dynamique pour dévoiler des propriétés structurelles et fonctionnelles à des fins de diagnostic; le pionnier de cette technique est le Dr. Raymond Murphy. On retrouve une bonne description de la méthode sur son site

• émission d’un son et analyse de sa propagation: cette technique consiste à émettre un son depuis un haut-parleur introduit dans la bouche du patient. Elle s’appuie sur une analyse des caractéristiques du signal propagé à travers les voies respiratoires et la cavité thoracique. Les paramètres analysés sont les ratios d’énergie, le délai de latence du signal, et les fréquences dominantes.
On se rapproche là des pratiques anciennes, décrites par Laënnec et ses élèves, qui consiste à effectuer une percussion sur le thorax, pour ensuite écouter les bruits générés par l'onde sonore qui traverse les tissus.
On retrouve également une technique similaire, mais dans une application très éloignée, dans la "sismique", pour la recherche de pétrole au traves des couches géologiques.

On mentionne également la technique qui consiste à appuyer le patient contre une porte ou toute autre paroi en bois, afin d'amplifier le signal acoustique.

4.2. Filtrage et suppression des bruits cardiaques

Les sons cardiaques peuvent introduire des perturbations lors de l’analyse des sons pulmonaires. Le spectre des sons cardiaques est situé entre 20 et 40000 Hz. Mais un filtre passe haut ne peut pas être une solution pertinente car la majorité des composantes pulmonaires sont également situées dans cette région. Différentes méthodes ont par conséquent été testées:

• ondelettes,

• filtrage adaptatif avec algorithme des moindres carrés récursifs,

• filtrage temps/fréquence et reconstruction,

• estimation autorégressif / moyenne mobile (AR / MA) en temps/fréquence avec des coefficients d’ondelettes,

• analyse des composantes indépendantes

• méthodes d’entropie.

Le filtre proposé par Bahoura et al. est basé sur une transformée en ondelettes par paquets, et l’utilisation de deux filtres qui sont définis dans le domaine fréquentiel et le domaine temporel. Ce filtre fournit des résultats plus fiables et plus efficaces que ceux de ses rivaux; les résultats expérimentaux ont démontré de très bonnes performances. De plus, la technique proposée permet de mieux préserver les caractéristiques des signaux stationnaires (sons normaux et sibilants).

Dans l’article de Yadollahi et al., l’atténuation des bruits cardiaques est obtenue à l’aide d’un simple filtre passe-bande [50 Hz, 2500 Hz]. C'est curieux, dans la mesure où on est en plein dans une plage de fréquence de signaux pertinents dans le domaine pulmonaire.

Parmi ces méthodes, les meilleurs résultats ont été obtenus à l’aide du filtrage adaptatif, du filtrage temps/fréquence et de l’estimation AR/MA.

4.3. Suppression des sons parasites

Au-delà des bruits du coeur qui sont prélevés en même temps que ceux des poumons (on peut demander au patient de ne pas respirer lorsque l'on écoute son coeur, on peut difficilement demander l'inverse !), il convient également de filtrer les bruits ambiants. Ce traitement peut être réalisé de deux manières différentes:

• la réduction du bruit par filtrage adaptatif (suppression du bruit blanc gaussien, du signal vocal, des erreurs de mesure);
• la réduction du bruit par paquets d’ondelettes (méthode de Donoho).

Des techniques plus récentes s’appuient sur l’utilisation simultanée de plusieurs capteurs.

5. Caractéristiques des sons pulmonaires

Il est généralement admis que la fréquence des sons pulmonaires se situe dans la plage 50–2500 Hz, celle des sons trachéaux pouvant aller jusqu’à 4000 kHz, ce qui permet de définir une fréquence d’échantillonnage à 8 kHz (théorème de Shannon). Les sons anormaux peuvent être divisés en deux sous classes:

• les sons continus ou stationnaires tels que les sibilants, les ronchis;

• les sons discontinus ou non stationnaires tels que les crépitants fins et gros.

Parmi les sons pathologiques, on citera aussi les squawks, les ronflements, et les stridors. Nous allons détailler les caractéristiques des deux bruits les plus étudiés : les sibilants et les crépitants.

5.1. Caractéristiques des cycles respiratoires

Bahoura propose sa définition des sons caractéristiques de l’inspiration et de l’expiration. Il situe le spectre des sons trachéaux entre 60 et 600 Hz pour l’inspiration et entre 60 et 700 Hz pour l’expiration.
Il propose ensuite une transformée de Fourier à 4096 points et représente ensuite le signal respiratoire sous deux formes:

• la méthode "chute d’eau" avec une représentation du spectre en trois dimensions (amplitude, fréquence, temps);

• la méthode du spectrogramme déjà évoquée.

Ces représentations permettent généralement une bonne visualisation du cycle respiratoire.

Nous avons développé un outil permettant ces visualisations en temps réel. C'est cet outil qui a été utilisé pour générer toutes les représentations qui sont fournies ici, ainsi que dans de nombreux articles rappelés dans la rubrique Publications.

5.2. Caractéristiques des sibilants

L’identification des sons pulmonaires continus anormaux tels que les sibilants dans le cycle respiratoire est d’une grande importance pour le diagnostic des pathologies liées à l’obstruction des voies aériennes respiratoires. Sovijarvi et al. indiquent que les sibilants peuvent présenter des composantes acoustiques indiquant, non seulement la présence d’anomalies dans le système respiratoire, mais également la sévérité et la localisation des obstructions des voies aériennes les plus fréquemment rencontrées dans l’asthme et les sténoses respiratoires.

L'image ci-dessus est celle de la respiration d'un nourrisson atteint de bronchiolite. Le trait noir horizontal est le marqueur de l'outil Alcatel-Lucent qui a détecté un sibilant.

Les sibilants, que Laënnec appelle râles sibilants secs, ou sifflements sont des sons d’une durée supérieure (selon les articles) à 50 ou à 100 ms et inférieure à 250 ms.

La plage de fréquence des sibilants est comprise selon les auteurs entre 100 et 2500 Hz avec un pic de fréquence fondamentale entre 100 (ou 400) et 1000 Hz (ou 1600 Hz). Selon certains auteurs, les sibilants ont une fréquence dominante supérieure à 400 Hz, par opposition aux ronchis dont la fréquence dominante est située à 200 Hz et moins. Enfin, chez les sujets asthmatiques, les sibilants sont présents dans l’expiration, avec une durée comprise entre 80 et 250 ms.
Albers et al. et Meslier et al. associent les sibilants aux pathologies suivantes: infections telles que le croup (infection qui touche habituellement les enfants d’un à trois ans), toux asphyxiante, laryngite, trachéobronchite aiguë, laryngomalacie, trachéo- ou bronchomalacie; tumeurs laryngales ou trachéales; sténoses trachéales; sténoses laryngales émotionnelles; aspiration d’un corps étranger; compression des voies aériennes et asthme.

5.3. Caractéristiques des crépitants

Les crépitants correspondent à des sons courts explosifs, généralement associés à des problèmes pulmonaires du type infection pulmonaire (pneumonie), oedème pulmonaire, etc ...

• Ils sont générés lors de l’ouverture des voies aériennes qui ont été fermées anormalement pendant la phase d’inspiration, ou lors de la fermeture en fin d’expiration. La détection des crépitants est importante car leur nombre est une indication possible de la sévérité d’une affection pulmonaire,

• Mais plus que leur nombre, leur positionnement dans le cycle respiratoire, et la forme de leur signal sont caractéristiques des cas de pathologies pulmonaires.

Forme d’onde d’un crépitant
IDW (largueur de déflexion initiale) est l’instant du début du crépitant jusqu’à la première déflexion. 2CD représente la durée de deux cycles à partir du début du crépitant. TDW correspond à la durée totale du signal crépitant.

Les crépitants débutent généralement par une déflection forte, suivie d’une onde sinusoïdale longue et amortie telles que représentées par la figure ci-dessus. Il est admis que la durée des crépitants est inférieure à 20 ms et que leur fréquence est comprise entre 100 et 200 Hz.
Par ailleurs, les crépitants peuvent être divisés en deux familles:

• les crépitants fins (que Laënnec appelle râles humides ou crépitations) qui sont caractérisés, selon les auteurs par: IDW = 0,50 ou 0,90 ms, 2CD = 3,3 ou 6 ms, et TDW= 4 ms. Ils sont exclusivement inspiratoires;

• les gros crépitants (le râle muqueux ou gargouillement chez Laënnec) qui sont caractérisés par: IDW = 1,0 ms, 2CD = 5,1 ms, TDW = 6,7 ms pour et par IDW = 1,25 ms, 2CD = 9,50 ms pour Vannuccini et al.; ils sont généralement inspiratoires, mais peuvent également être expiratoires.

L’article Piirila et al. nous indique les principales pathologies dans lesquelles on retrouve des crépitants:

• fibroses pulmonaires : 2CD inférieur à 8 ms, fréquence de l’ordre de 200 Hz;

• asbestoses : durée des crépitants d’environ 10 ms;

• bronchiectasies : 2CD supérieur à 9 ms, ils apparaissent plutôt tardivement dans le cycle inspiratoire et ont une durée relativement longue par rapport à la phase respiratoire;

• bronchopneumopathies chroniques obstructives (BPCO): 2CD supérieur à 9 ms, débutent généralement tôt dans l’inspiration et se terminent avant le milieu de l’inspiration (voir l'image et le son correspondant);

• insuffisances cardiaques (2CD >10 ms);

• pneumonies : 2CD entre neuf et 11 ms, ils apparaissent en milieu d’inspiration;

• et sarcoïdose.

6. Détection des marqueurs connus

à ce jour, les marqueurs connus et décrits dans la littérature sont les crépitants et les sibilants.

Différentes méthodes d’analyse ont été exploitées et décrites. On citera l’analyse temporelle de l’onde pour la recherche des crépitants, et l’analyse fréquentielle (transformée de Fourier, spectrogramme en 2D ou en 3D, sonogramme) utilisés dans la détection des sibilants.

Dans les techniques d’analyse spectrale, les principaux paramètres sont la fréquence moyenne du spectre de puissance, la fréquence de la puissance maximale, le nombre de pics dominants, le facteur de décroissance exponentielle.

Enfin, l’analyse temps–amplitude et temps–fréquence est classiquement réalisée à l’aide de transformée en ondelettes.

Parmi les solutions les plus récentes, on citera l’utilisation d’un perceptron multicouche d’un réseau de neurones, des algorithmes génétiques et une solution hybride entre les deux.
La recherche des paramètres est effectuée par méthode d’apprentissage.
Guler et al. constatent que la solution hybride est la plus performante.
Murphy et al. montrent qu’un analyseur multicanaux (plusieurs capteurs utilisés simultanément) est capable de détecter des différences significatives entre les sons pulmonaires de patients atteints de pneumonie et les patients ne présentant pas de symptômes.

6.1. Détection des sibilants

On trouve de nombreux articles décrivant une technique d’analyse spectrale pour la détection des sibilants. En effet, la caractéristique essentielle de ces sons réside dans les pics d’énergie qui peuvent être visualisés dans le spectre. Les limites de cette méthode résident dans l’existence, dans les sons pulmonaires normaux, de pics similaires à ceux caractérisant les sibilants, ce qui entraîne un taux élevé de fausses détections.
Les difficultés rencontrées dans l’automatisation de la détection des sibilants peuvent être surmontées par une analyse conjointe temps–fréquence. Le principe est le suivant : la détection dans le domaine fréquentiel d’un pic susceptible de correspondre à un sibilant sera suivie d’un second test dans le domaine temporel pour confirmer les vrais sibilants et rejeter les faux.
Selon Homs-Cobrera et al., les paramètres significatifs sont la fréquence et le nombre moyen de sibilants détectés. Ils utilisent les paramètres : nombre de sibilants, fréquence moyenne du sibilant avec pic de puissance le plus élevé, fréquence moyenne du sibilant avec pic de moyenne puissance le plus élevé, fréquence moyenne, emplacement des sibilants. Les paramètres sont définis après avoir divisé le champ de fréquence en bandes de 50 Hz. De plus, l’algorithme cité montre qu’il y a une forte corrélation entre le nombre de sibilants détectés et l’amplitude du signal; cela est dû à la dépendance entre le facteur de normalisation et les seuils des règles floues. Les spectrogrammes fournissent une représentation visuelle de la localisation des sibilants. Cependant, ces informations ne s’avèrent pas être suffisantes pour caractériser objectivement les sons. Une autre procédure de détection automatique des sibilants a été proposée.
Elle est basée sur la décomposition par paquets d’ondelettes, en deux étapes, comportant en premier lieu, une détection fréquentielle avec extraction des sibilants, puis après transformation inverse et reconstruction du signal utile, une détection temporelle permettant là aussi d’éliminer les fausses détections résultant d’une superposition des domaines spectraux de certains sons normaux avec des sibilants.

à partir des spectrogrammes générés par les sons enregistrés, Lin et al. réalisent un filtrage bilatéral 2D pour la préservation du lissage aux bords.
Les résultats indiquant une haute efficacité du système, les auteurs ambitionnent d’utiliser ce système pour le monitoring de patients asthmatiques et l’étude de la physiologie des voies aériennes.
L’article de Meslier et Charbonneau s’appuie également sur l’analyse et la quantification automatique des sibilants à partir de l’analyse spectrale.
Ces algorithmes sont basés sur la définition d’un seuil au-dessus duquel la présence de pics dans le domaine fréquentiel, est caractéristique du sibilant. Ces seuils sont différents selon les articles (on trouvera ainsi la caractérisation d’un pic par une puissance 15 fois supérieure à la moyenne courante, ou trois fois supérieure à la valeur moyenne). Toutes ces études définissent des seuils constants, basés sur des mesures de puissance. La référence confirme les mauvaises détections de sibilants à l’aide d’analyse fréquentielle seule. Cet article décrit un nouvel algorithme basé sur la « modélisation auditive », appelé frequency and duration dependent threshold (fddt) algorithm.

Les paramètres de fréquence moyenne et durée de sibilants sont obtenus automatiquement. La notion de seuil dépendant de la fréquence et de la durée a été introduite dans le nouvel algorithme pour la détection de sibilants.
Le seuil n’est plus basé sur la puissance globale mais sur la puissance correspondant à une plage de fréquence particulière. Le choix de l’énergie au lieu de la puissance a été fait suite aux résultats des études antérieures indiquant qu’un seuil énergétique est plus adapté à la détection de sons de courtes durées (inférieure à 200 ms). De leur côté, certains auteurs s’appuient sur une méthode de transformée en ondelettes continues, combinée avec un seuil dépendant de l’échelle, et semble avoir un taux de bonne reconnaissance plus élevé.

Méthodologie Paramètres Taux de classification correcte (%)
Analyse temps–fréquence Bande passante gaussienne, fréquence des pics, largueur de déflexion totale, largueur de déflexion maximal 87,78
Analyse temps–fréquence Bande passante gaussienne, fréquence des pics, largueur de déflexion maximal 90,5
Modélisation prony Paramètres du modèle de Prony
Coefficients autorégressifs 63,89
Transformée en ondelettes échelle de l’ondelette mère
Transformée en ondelettes basée sur la dimension fractale
Transformée en ondelettes stationnaire/non stationnaire 93,9
ND
ND

Règles floues 27 règles floues ND
Réseau de neurones artificiels Coefficients autorégressifs, coefficients d’ondelette, paramètres de crépitants ND
Mode de décomposition empirique Instrinsic mode function ND

6.2. Détection de crépitants

L’analyse des crépitants est constituée de trois étapes principales:

• un filtre de suppression de bruit est appliqué pour supprimer le bruit résiduel stationnaire dans un signal non stationnaire;

• une recherche de la forme d’onde correspondant au crépitant;

• les crépitants détectés sont classifiés en deux categories : les crépitants fins et les gros crépitants.

Kayha et Yilmaz proposent un système automatique de détection et de classification des crépitants. Le système proposé utilise un filtre stationnaire/non stationnaire et la transformée en ondelettes par paquets (ou WPST–NST) qui permet d’isoler les crépitants des sons vésiculaires. Celui de Kawamura a montré l’existence d’une corrélation entre les sons respiratoires et la détermination des tomographies informatiques haute résolution.

Deux paramètres, deux cycles, et la largeur de la déflexion initiale des crépitants ont été induits par l’analyse du signal temporel.
Kayha et al. décrivent un système basé sur l’augmentation des phénomènes transitoires à l’aide d’un filtre adaptatif et l’implémentation d’opérateur non linéaire aux compositions en ondelettes du son pulmonaire.
L’article de Yeginerand et al. décrit également l’utilisation de réseaux d’ondelettes pour modéliser les crépitants pulmonaires.
L’algorithme proposé par Vannucci et al. utilise un filtre stationnaire–non stationnaire flou (FST–NST). Les résultats de la séparation sont relativement fiables.
Le filtre FST–NST a été appliqué à des sons provenant de trois bases de données. Tout d’abord, les crépitants ont été séparés du sons vésiculaire. Puis, 27 règles floues de type « si, alors » ont été utilisées. L'auteur détecte des crépitants et les sons intestinaux par une analyse de la dimension fractale des enregistrements.

Les résultats semblent concluants et, de plus, robustes au bruit. La comparaison des résultats de différentes méthodes est résumée dans le tableau ci-dessus. Les meilleurs résultats de classification sont obtenus en utilisant l’analyse par ondelettes. Les représentations des paramètres de Prony indiquent une corrélation entre le type de pathologie, l’occurrence des crépitants par rapport au volume pulmonaire et la fréquence de Prony.

6.3. Détection du cycle respiratoire

Afin de fournir des résultats exploitables, l’information doit toujours être ramenée à un cycle respiratoire. Il y a donc un intérêt certain dans la détection automatique des phases (inspiration/ expiration).
Moussavi et al. utilisent la moyenne de puissance spectrale du signal respiratoire et la différence entre la puissance spectrale du signal trachéal et celle du signal pulmonaire pour détecter les phases respiratoires. Les résultats ont indiqué un taux de classification correcte situé entre 31 et 69%.

En outre, la différence entre la moyenne de puissance spectrale inspiratoire et expiratoire, dans une tranche de fréquence comprise entre 150 et 450 Hz est au maximum de 10 dB.
Cette méthode fonctionne très bien avec des sons artificiels ; cependant, elle ne permet pas une réelle classification des sons. Enfin, dans la référence, il est proposé de qualifier les sons en utilisant la dimension fractale et un paramètre appelé variance fractal dimension.
Guler et al. quant à eux utilisent une classification en six phases : début, milieu, fin d’inspiration, et début, milieu, fin d’expiration ; cette méthode s’appuie sur l’utilisation d’un « classifieur » multicouches. Les caractéristiques extraites sont les paramètres autorégressifs et les coefficients cepstaux. Le développement d’un tel outil rencontre deux difficultés majeures :

• les signaux respiratoires ne sont pas stationnaires à cause du changement de volume dans les poumons ;

• les sons respiratoires présentent une grande variabilité en fonction de l’âge, de la masse, du stade d’évolution de la pathologie.

L’article de Guler et al. se base sur un perceptron multicouches. Il obtient environ 60% de bonne reconnaissance pour la phase experte sur les segments individuels.
Pour obtenir ce résultat, il utilise une autre caractéristique des signaux pulmonaires : la puissance spectrale des sons pulmonaires pendant la phase d’inspiration est supérieure à celle de la phase d’expiration. Cette caractéristique peut être utilisée seule pour permettre la détection de phases.

De la même façon, Chuah et Moussavi utilisent un calcul de la valeur moyenne de la puissance spectrale pour qualifier le cycle respiratoire. Cette analyse est complétée par un calcul de la valeur moyenne de la puissance spectrale trachéale afin de déterminer le début des respirations.

Carlos et Verbandt utilisent deux réseaux de neurones indépendants (ANN): l’un pour les phases d’inspiration, et l’autre pour celles d’expiration. Au préalable, un prétraitement est effectué en normalisant le signal en amplitude entre zéro et un.

L’étape suivante met en jeu des ANN avec une couche cachée. Les paramètres sont obtenus à l’aide d’algorithmes d’apprentissage utilisant des techniques de backpropagation. Ensuite, un post-traitement est appliqué ; il consiste à supprimer certains « 1 » qui se situent entre au moins cinq « 0 » et inversement. Ces techniques ont été appliquées sur 28.000 sons enregistrés à l’aide de pléthysmography inductive (mesure de volume) ou de jauges de contraintes. Les résultats avoisinent les 98% de réussite.

6.4. Classification des sons

En médecine pulmonaire, il n’existe pas de modèle universel ou de seuil des paramètres indiquant ou non la présence d’une pathologie.
C'est un peu la raison pour laquelle Zheng et al. proposent d’établir un modèle personnalisé, combinant l'information provenant des sons et d'autres mesures réalisées sur le patient. Leur objectif est de reconnaître un modèle de son pulmonaire.
La méthode appliquée a été divisée en deux étapes : caractériser les variables extraites de la forme d’onde des sons pulmonaires et les variations de ces paramètres; cela fournit une information sur les variations des modèles.
Guler et al. se focalisent sur les techniques d’intelligence artificielle. Ils combinent algorithme génétique et réseau de neurones. En premier lieu, ils sélectionnent des cycles respiratoires complets, auxquels ils appliquent une power spectral density (PSD) de 256. Puis, un perceptron multicouche est appliqué pour détecter la présence ou l’absence de sons adventices (crépitants ou sibilants).

La recherche des paramètres optimaux a été réalisée par méthode d’apprentissage. Chaque son est associé à plusieurs caractéristiques et à un diagnostic. Cent vingt-neuf caractéristiques spécifiques ont été recensées (PSD0. . . PSD128) et différentes règles d’apprentissage ont été utilisées pour associer caractéristique et diagnostic. Dans la référence, les auteurs réalisent une comparaison entre k-NN et ANN (réseau de neurones artificiels).
Ils utilisent différentes fonctions extraites du signal respiratoire. En fait, chaque cycle est divisé en six segments avec trois fonctions : coefficient autorégressif, coefficient en ondelettes et paramètres de crépitants.
Les paramètres de crépitants sont ajoutés aux caractéristiques observées afin d’augmenter les performances de la classification. Cette amélioration des performances a été confirmée par les tests réalisés. L’étude se focalise sur quatre pathologies: l’asthme, les bronchiectasies, la BPCO et la pneumonie.

Le son est divisé en six sous-phases : début (30%), milieu (40%), fin (30%) d’inspiration et expiration.
Les expérimentations sont appliquées à chaque sous-phase. Des classifieurs neuronaux (perceptrons multicouches avec couche cachée de dix noeuds) sont utilisés avec les paramètres suivants:
• paramètres autorégressifs,
• prédiction d’erreur,
• durée des ratios inspiration / expiration.

Les poids et valeurs du perceptron sont mis à jour à l’aide de l’algorithme d’optimisation de Levenberg–Marquardt, qui est l’un des plus rapide. Puis, la classification est réalisée en trois étapes :
• pathologique / sain,
• restrictive / obstructive,
• classification entre les pathologies (asthmes, bronchiectases).

La fiabilité est calculée «nombre total de classification correct / nombre total de segments».

Finalement, les performances de classification avoisinent les 70 à 80%.

L’étude décrit une méthode de prétraitement visant à réduire la taille des modèles d’entré dans le réseau de neurones, et à augmenter la performance d’estimation du classifieur.

Les résultats indiquent que les ondelettes sont des capteurs significatifs du signal et extraient des paramètres importants.

Cohen et al. réalisent une classification des sons normaux et pathologiques en deux étapes : prédiction linéaire des coefficients et enveloppe énergétique. Sept types de sons respiratoires ont ainsi été classifiés, parmi lesquels quatre sons normaux : son vésiculaire, son bronchique, son bronchovésiculaire et sons trachéal. Les fonctions extraites sont FFT, PDS, estimation par moyenne de prédiction linéaire. Cependant, dans cette étude, une décision manuelle des inspiration / expiration a été réalisée. Les principaux objectifs sont les suivants : caractériser de façon quantitative plusieurs sons respiratoires et fournir une méthode de classification automatique.

Enfin, le diagnostic est réalisé par un médecin et est basé sur l’analyse des sons associée à d’autres éléments de diagnostic.

Sur 105 expérimentations, seules cinq ont généré des erreurs. Dokur et al. utilisent les transformées en ondelettes. Les meilleurs échantillons sont sélectionnés par programmation dynamique et un réseau de neurone Grow et Learn est utilisé pour la classification. Le processus de décision est effectué en trois étapes : normalisation, extraction de caractéristiques, classification par réseau de neurones.

Les perceptrons multicouches couramment utilisés dans le traitement du signal biomédical présentent trois inconvénients majeurs :
• la rétropropagation de l’algorithme est trop longue durant la phase d’apprentissage;
• le nombre de noeuds dans les couches cachées doit être défini avant la phase d’apprentissage;
• la rétropropagation de l’algorithme doit prendre en compte le minimum local, qui diminue les performances du réseau.

7. Facteurs influençant la mesure

Il existe des éléments perturbateurs à l’analyse du signal auscultatoire, qui modifient les résultats et rendent plus compliquée la comparaison des résultats entre les différentes équipes de recherches. Parmi ceux-ci, il faut retenir l’âge et la corpulence du patient, le changement du volume d’air dans les poumons, le point de prise du son, le débit de ventilation, la position du patient, et les caractéristiques de l’équipement de mesure.

7.1. Âge et corpulence

La différenciation liée à l’âge est surtout vraie pour les enfants en bas âge. Elphick et al. notent que l’évaluation au stéthoscope est peu fiable pour la détection des sibilants, et autres crépitants; en effet, les bruits respiratoires audibles dans la petite enfance possèdent des caractéristiques acoustiques distinctes de celles habituellement observées chez l’adulte.
Mazic et al. proposent donc d’utiliser des méthodes plus objectives pour la détection automatique de sibilants

7.2. Changement de volume d’air dans les poumons

La caractérisation statistique du processus évolue dans un cycle respiratoire. En effet, les signaux respiratoires sont non stationnaires, notamment à cause du changement du volume pulmonaire et du niveau de flux dans un cycle. Ainsi, pour interpréter correctement les résultats, il est conseillé de se ramener au volume d’air pulmonaire.

7.3. Standardisation du protocole de mesure

Afin de pallier à ces limitations, il a été proposé de définir une sémiologie adaptée à la collecte et à l’analyse de sons auscultatoires. Ces travaux ont conduit à une proposition de standardisation proposée par le projet européen CORSA, qui décrit les points d’auscultation, le type de capteurs, le filtrage, la fréquence d’échantillonnage, la technique de FFT, la définition d’une moyenne du spectrogramme et l’utilisation de taux de flux standards.

8. Conclusions et perspectives

Un enregistrement réalisé dans de bonne condition et avec un équipement adapté est la première étape pour une bonne analyse des sons.

L’analyse automatique et le traitement des sons auscultatoires pulmonaires permettent ensuite d’obtenir une analyse objective du signal, et une possibilité de comparaison des sons, de suivi de l’évolution d’une pathologie dans le temps. Le traitement du signal devrait, de plus, permettre de découvrir de nouvelles caractéristiques des sons adventices jusqu’alors non perceptibles à l’oreille humaine.

L’état de l’art met en lumière les nombreuses méthodes appliquées à l’analyse des sons ; ces méthodes fournissent des résultats très encourageants pour aller vers une aide au diagnostic toujours plus fiable et utile au patient et au médecin.