L'analyse de texte

[ 15/04/04 - Contributions - 5 commentaires]

La rubrique "Contributions" publie des textes écrits par des auteurs extérieurs à la rédaction d'ActuLab (en savoir +...). "L'analyse de texte" est un texte de Bernhard Huber webmaster de Textalyser.

Les textes constituent l'essence d'internet. Google ne se base que sur les textes, parce qu'ils sont beaucoup plus faciles à traiter que les images ou les sons, et qu'ils transmettent plus d'information.

Textalyser, outil d'analyse de textes Comment savoir de quoi est fait un texte? On peut bien sûr le lire, en analyser le sens. A défaut de connaître la langue dans laquelle il est écrit, il est possible d'en déterminer l'idée globale en l'analysant statistiquement.

C'est ce que font les moteurs de recherche: compter les mots, déterminer ceux qui apparaissent le plus souvent et attribuer un thème à une page, en fonction des mots ou des combinaisons de mots qu'elle contient.

L'analyse statistique des textes nous permet de voir synthétiquement les documents internet avec les yeux de Google.

Elle nous apporte de nombreux éléments sur un texte et le vocabulaire de son auteur: utilise-t'il toujours les mêmes mots, utilise-t'il des mots de moins de cinq lettres comme le président des Etats-Unis, ou au contraire a-t'il une richesse lexicale, qui le rend plus difficile à lire.

Le fait de connaître les mots les plus présents résume rapidement un texte. Plus un texte est long, plus l'analyse sera pertinente. Elle peut ainsi nous épargner de longues lectures inutiles, en extrayant rapidement l'essentiel d'un texte.

Le nombre de syllabes des mots d'un texte détermine sa facilité de lecture. Un texte uniquement composé de mots octosyllabiques serait en effet non seulement difficile à comprendre, mais aussi suspect au niveau de sa naturalité et de ses objectifs.

Textalyser est un outil d'analyse de textes en ligne qui fournit des données statistiques détaillées. Il s'adresse aux traducteurs (devis), aux webmasters (analyse de densité) et à tous les utilisateurs qui souhaitent analyser rapidement un texte. Essayez-le...

Bernhard Huber - Textalyser

Vos réactions à cet article :::

le 10/05/2004 à 23:05De:
Mouaif, c'est une bonne idée de mettre en ligne un outil de ce type, mais l'analyse est brute de fonderie. Comment en tirer des conclusions pour l'indexation par Google par exemple ? (Et puis l'algorythme utilisé par Google est-il connu d'ailleurs ?)
Pour l'analyse de complexité, on aimerai bien savoir quels sont les critères utilisés. Bref, cette version beta mérite encore un peu de travail.
Pour des infos plus complètes sur le référencement, allez donc sur abondance !
François, webmestre
le 12/05/2004 à 17:29De: [Site web]
»Réponse à fran
ce n'est pas un site d'informations sur le referencement...
le 01/06/2004 à 17:03De: [Site web]
oui, l idee est bonne ,a approfondire
le 20/06/2004 à 16:59De: [Site web]
Je pense que c'est une évolution obigatoire ce genre de programme qui vont bientôt se compliquer d'analyse linguistique et de contexte. Au vu de l'évolution du nombre de pages indexées, cette évolution me semble très proche.
le 20/06/2004 à 18:30De: [Site web]
Le New York Times met l'excellent Textalyser à l'honneur.
Pour découvrir l'article, rendez-vous sur Google news, puis suivez le lien Harry Potter.
Dans la page du NYT, lisez l'article sous le titre "Dissect a Speech".
Un outil plein d'avenir...

Ajoutez un commentaire en direct :::

Il est temporairement impossible de poster un commentaire: nos modos sont en vacances. A bientôt;)

[Envoyer cette page à un ami | Créer un lien vers cette page | Ajouter cette page à vos favoris]
38.578.582 pages vues - Déjà 1.582 aujourd'hui - 13 visiteurs connectés
100 dossiers en ligne - Copyleft © 2003-2008 ActuLab :::