[ 15/04/04 - Contributions - 5 commentaires]
Les textes constituent l'essence d'internet. Google ne se base que sur les textes, parce qu'ils sont beaucoup plus faciles à traiter que les images ou les sons, et qu'ils transmettent plus d'information.
Comment savoir de quoi est fait un texte? On peut bien sûr le lire, en analyser le sens. A défaut de connaître la langue
dans laquelle il est écrit, il est possible d'en déterminer l'idée globale en l'analysant statistiquement.
C'est ce que font les moteurs de recherche: compter les mots, déterminer ceux qui apparaissent le plus souvent et attribuer un thème à une page, en fonction des mots ou des combinaisons de mots qu'elle contient.
L'analyse statistique des textes nous permet de voir synthétiquement les documents internet avec les yeux de Google.
Elle nous apporte de nombreux éléments sur un texte et le vocabulaire de son auteur: utilise-t'il toujours les mêmes mots, utilise-t'il des mots de moins de cinq lettres comme le président des Etats-Unis, ou au contraire a-t'il une richesse lexicale, qui le rend plus difficile à lire.
Le fait de connaître les mots les plus présents résume rapidement un texte. Plus un texte est long, plus l'analyse sera pertinente. Elle peut ainsi nous épargner de longues lectures inutiles, en extrayant rapidement l'essentiel d'un texte.
Le nombre de syllabes des mots d'un texte détermine sa facilité de lecture. Un texte uniquement composé de mots octosyllabiques serait en effet non seulement difficile à comprendre, mais aussi suspect au niveau de sa naturalité et de ses objectifs.
Textalyser est un outil d'analyse de textes en ligne qui fournit des données statistiques détaillées. Il s'adresse aux traducteurs (devis), aux webmasters (analyse de densité) et à tous les utilisateurs qui souhaitent analyser rapidement un texte. Essayez-le...
Bernhard Huber - Textalyser
Il est temporairement impossible de poster un commentaire: nos modos sont en vacances. A bientôt;)