26/05/2009

Text Analyzer : analyse statistique de texte

Un petit outil d'analyse de texte qui restitue :
Le nombre d'occurrences de chaque mot et de chaque groupe de mots



La taille du fichier ; nombre total de mots ; nombre de mots différents :
(par lines il faut comprendre plutôt paragraphes)



La liste des mots uniques :




Il fonctionne de deux façons : soit en donnant le chemin du fichier à analyser, soit en copiant/collant le texte dans son interface.


Ghacks indique que le soft peut être utile aux webmestres pour optimiser leur référencement, mais j'y vois des utilisations bien plus larges comme par exemple l'analyse de ses propres textes pour en dégager les lourdeurs syntaxiques, ou de documents à crypter/décrypter.

Text Analyzer est compatible avec Windows XP et Windows Vista et nécessite Microsoft .net Framework 3.5 pour fonctionner. Il est totalement gratuit.

Via Ghacks

25/05/2009

TwiPing : mettre un turbo dans son Twitter


Voilà un outil redoutablement efficace pour augmenter rapidement l'audience d'un compte Twitter.
Développé par Jeremy D. Mullin, twiPing n'est pas un programme client, c'est-à-dire qu'il ne sert pas à envoyer des Tweets. Cependant il fait beaucoup mieux : après communication du nom du compte et de son mot de passe, il recherche et affiche les Followers et les Friends de n'importe quel compte et en affiche les caractéristiques. A partir des données brutes fournies, il est ensuite possible d'affiner la sélection à partir de mots-clés, et enfin d'ajouter l'ensemble ou certains individus à vos propres Friends, et tout cela en un nombre de clics plus que raisonnable.


Des outils approchants existent déjà, bien sur mais ce qui fait la supériorité de twiPing est sa simplicité d'utilisation et sa rapidité d'exécution. La preuve : en moins de 5 minutes, j'avais saturé Twitter de requêtes ;-). J'ai un moment craint que Twitter ne m'ait banni grâce à mon IP pendant une longue période, mais un quart d'heure plus tard, il était de nouveau opérationnel.
Allié à un outil de nettoyage comme MyCleenr, qui permet de supprimer les Friends n'ayant pas d'activité récente, twiPing donne un élan considérable à Twitter tout en laissant la maîtrise à l'utilisateur.

20/05/2009

Twitter for busy people - les derniers tweets de vos friends

Comme j'ai pas mal de contacts avec des américains qui, ne connaissant pas les usages, se couchent quand moi je me lève et inversement, j'ai eu besoin de trouver une application Twitter qui me permette d'embrasser littéralement la totalité de mes friends sur un voire deux écrans, y compris ceux qui n'ont pas les mêmes horaires que moi. J'ai trouvé celle-ci : 



En ligne depuis début avril seulement, elle affiche les avatars des friends classés selon trois catégories :





  
Les images valent toujours mieux qu'un long discours.
Sur le plan sécurité, on ne rentre que son pseudo, pas son mot de passe.
Gadget : lorsqu'on survole l'avatar du friend, une fenêtre popup apparaît contenant son dernier Tweet.


17/05/2009

Twitter StreamGraphs : representation de mots-cles sur timeline graphique


Oui, c'est la énième application Twitter, mais chacun de ces petits gadgets contribue à l'édifice. Encore faut-il se rappeler de leur existence, noms et qualités.
Nous voici devant StreamGraphs, qui affiche sur les 1000 derniers tweets, d'un côté à partir d'un mot-clé donné, les mots-clés qui lui sont associés ; ou bien simplement les mots-clés d'un utilisateur donné.
Il faudra dans ce dernier cas faire précéder le TwitterUser recherché du caractère @ comme à l'accoutumée dans Twitter.
Le design est signé Lee Byron, lequel semble être également le designer de FriendWheel, au vu des ses autres travaux.
Cette application affiche donc l'activité d'un @twitteruser sur une timeline graduée ; et la fréquence d'utilisation d'un tag sur une timeline qui peut se réduire à quelques heures selon sa célébrité.
Sous le diagramme, sont affichés in extenso les derniers tweets correspondants à l'entité recherchée.
Enfin le service est 'réentrant', ce qui veut dire qu'à partir d'un mot-clé ou d'un @twitteruser, on peut recliquer sur un tag associé, inscrit dans le diagramme ou un autre user sous le graphe pour relancer le traitement à l'infini.
Exemple de recherche sur le mot-clé 'hadopi' : où l'on peut voir que l'intensité du débat fond littéralement à l'arrivée du week-end ;-).
 
Le chiffre de 332, non surligné, indique (je suppose) le pic principal en nombre de tweets sur la période affichée. Les intervalles (cerclé d'orange) sont d'un peu moins de 3 heures. Le trait noir indiqué d'une flèche permet en le faisant glisser, de modifier l'échelle de l'axe des y (vertical). L'échelle de temps ne peut pas être modifiée. Cerclé de jaune, un tag associé, qui, cliqué, vient remplacer le terme recherché pour commencer une nouvelle recherche. Astuce livrée par Neoformix, le concepteur : on peut restreindre la recherche en tapant plusieurs mots-clés dans le champ, séparés par une virgule ou un +, le résultat est équivalent.
Second exemple, recherche sur 'eurovision', où on peut voir que la timeline s'étale sur à peine quelques heures car la limite de 1000 tweets est rapidement atteinte :
Neoformix est un grand spécialiste de la représentation des données (data vizualisation) et doté d'un sens artistique certain.

14/05/2009

Geolocalisation des navires equipes de la balise AIS par GoogleMaps


Impressionnant mashup de visualisation et géolocalisation des navires de commerce voguant sur toutes les mers du globe. Le terme mashup est presque réducteur, mieux vaudrait parler de base de données avec mise à jour permanente.
Cette base est le fruit d'un projet communautaire. Le but est de collecter des informations dans une longue liste de domaines de recherches, dont voici quelques exemples :
  • Progrès des télécommunications marines
  • Mise en forme des bases de données temps réel
  • Statistiques de trafic portuaire
  • Mise au point de modèles pour déterminer les points d'origine de pollutions marines
  • Calculer les meilleures routes maritimes et prévoir les heures d'arrivée
  • Superposition des données météo
  • Etc ...
Le système de géolocalisation est basé sur l'AIS, Automatic Identification System, transpondeur qui depuis 2004 équipe les navires de plus de 229 Giga tonnes. Véritable carte d'identité du navire, transmise régulièrement par VHF, ainsi que sa route. Les stations de collecte de données sont terrestres et ont une portée de 40 nautiques, ce qui explique que sur la carte on voit principalement les navires à l'entrée et à la sortie des ports. A croire que les supertankers font du cabotage ;-). Il existe bien sur d'autres réseaux de repérage par satellite.
Ne pas rater la FAQ du mashup où toutes ces informations sont détaillées.
Coté possibilités, on a bien sur la carte du monde estampillée GoogleMaps, sur laquelle sont positionnés les vaisseaux. La liste complète des vaisseaux avec carte d'identité, et clicable est disponible. La liste des ports avec par exemple les départs depuis les dernières 24 heures ; ainsi que la galerie de portraits des navires. Le tout avec de nombreuses possibilités de tri.

 
Même une série de webcams dans les iles grecques. Manque que l'âge du capitaine.
De plus, cliquer directement sur un navire dans la GoogleMap affiche une bulle contenant un résumé des infos sur le navire donné et des liens clicables vers les autres fonctionnalités de ce qui apparaît vraiment comme un portail d'informations sur le trafic maritime mondial. En cherchant bien on trouve même les positions de certains navires plutôt destinés au contrôle des autres, qu'au transport de fret...
Il existe enfin le code pour implémenter une carte sur un autre site ou blog, et la possibilité d'afficher ces données sur GoogleEarth.
Marinetraffic

12/05/2009

Analog X Link Examiner : freeware de SEO pour les webmestres

Tout webmestre se doit de connaître l'importance de la SEO (Search Engine Optimization), des liens internes, de l'utilisation de no-follow en certaines circonstances. Si vous avez des liens rompus ou du contenu dupliqué, cela risque d'avoir des répercussions spectaculaires sur les indexations de Google et Yahoo.
Il existe plusieurs outils SEO qui vous permettent de vérifier les liens brisés, le contenu dupliqué, l'absence de mots-clés, et plus encore. Mais ces outils sont trop compliqués à utiliser et certains sont onéreux, d'autres encore ne sont pas au point.
AnalogX LinkExaminer est un outil gratuit pour webmestre qui vérifie vos liens rompus. Il affiche les renseignements suivants :

  • HTTP Code,
  • HTTP Message,
  • Internal,
  • Robots.txt,
  • NoFollow,
  • Dynamic,
  • Relative,
  • SEO(Missing Keywords),
  • Title,
  • Depth,
  • In/Out,
  • Last Modified,
  • Link Type,
  • Duration,
  • Similarity(Duplicate content).
 Voila un exemple de commentaires que l'on obtient sur tel ou tel lien collecté par Analog X Link Examiner :



Je ne m'apesantis pas sur les fonctions basiques. Ceux qui ont utilisent ce genre de soft savent ce qu'ils vont y trouver. Voyons les gadgets plus spécifiques :
Un clic droit sur un link permet d'afficher plus de détails, voir ci-dessous :

 
Où on peut voir tous les liens entrants et sortants de la page considérée. Dans Blogger, cela permet de lister tous les billets comportant tel mot-clé, ceux-ci ayant été répertoriés comme liens sortants dans le traitement global (c'est clair, non ?).
Je vous fais grâce des autres outils genre copie de l'Url vers le presse-papiers ; ouverture dans un navigateur, etc...
Analog X Link Examiner est compatible Windows 2000/XP/Vista/7.
 
Ce billet-ci est une traduction très libre de ce billet-là

11/05/2009

S2 services : des freewares pour tenter de restaurer les docx et les xlsx


Les fichiers de type Microsoft Office Word 2007 et Excel 2007 peuvent être endommagés de différentes manières. Les cas les plus fréquents étant lors d'un transfert de données et d'une panne du disque dur. Une fois l'accident survenu, il est parfois difficile de retrouver ses petits, Microsoft renvoyant systématiquement un message de corruption de données sans autre précision. Il existe des logiciels onéreux permettant de récupérer ces données mais il en existe également des gratuits :
Excel 2007 Corrupt xlsx2csv
Word 2007 Damaged docx2txt

Les deux outils ont été développés par S2 services.

Résultat du test pour Damaged docx2txt : non fonctionnement complet sous Vista, même en mode Administrateur et compatibilité XP. De plus le processus est resté actif, et plutôt que de chercher l'aiguille inconnue dans la botte de foin trop connue, j'ai préféré réinitialiser la bestiole.
Pour me mettre en conformité avec le site de référence, j'ai souhaité installer Microsoft Framework 2.0, mais Vista m'a répondu qu'il était déjà installé comme on peut le constater ci-dessous :-)


Il faut en conclure que Microsoft garantit la compatibilité ascendante... Mon problème ne vient donc pas de là.
Quand au logiciel de récupération de fichiers xlsx, les deux exécutables livrés se contentent d'afficher brièvement une fenêtre type DOS et basta, même pas de message d'erreur.
Si quelqu'un est arrivé plus loin que moi, ou possède une explication, je suis preneur.
Le plus curieux est que les logiciels sont tamponnés Vista compatibles sur le site de l'éditeur : 
On pourra trouver les freewares en téléchargement directement sur ce dernier lien.
Traduction plutôt libre basée sur l'article de Rizwanashraf, les tests et les conclusions sont originaux ;-).

Considérations sur la loi de Godwin

 
Dans les discussions sur les forums Usenet, ou encore dans une simple mailing list,  je me suis aperçu qu'il est très difficile de conserver un niveau de rigueur propre à obtenir un résultat positif. Partant du principe que toute discussion commence par une question d'un individu posée à une communauté, on obtient toutes sortes de résultats plus ou moins heureux : soit un interlocuteur pose une autre question, un second répond par une boutade, un troisième répond carrément hors-sujet, un autre encore répond sur un ton méprisant à la question du second, tout ceci crée un climat propice à une nouvelle vérification de la loi de Godwin.
Cette loi existait bien avant Internet, nous n'avons pas attendu l'apparition des ordinateurs pour ne pas s'écouter, se parler à soi-même et ne rien comprendre aux autres, en admettant que nous en ayons eu envie. Il en va un peu du comportement de l'internaute comme de l'automobiliste : bien caché derrière un tas de feraille, nous houspillons, nous gaussons, émettons de doctes paroles, du moins certains d'entre nous ;-).
Tout cela pour dire qu'il faut parfois une bonne dose de philosophie (que je n'ai pas) pour supporter les sarcasmes et autres incohérences, sans parler des styles télégraphique et SMS, ou encore des carences, le mot est faible, grammaticales et orthographiques caractérisant le geek moyen, savant ou non qui hante les forums.
Fin de la parenthèse.

09/05/2009

FriendWheel reinvente la roue pour les friends de Twitter


Friend Wheel est une application Facebook permettant de visualiser sur un cercle multicolore les friends d'un utilisateur Twitter donné.
Une série de paramètres de visualisation est disponible : taille ; couleurs ;  ordonnancement.
Le résultat est tout à fait saisissant. En un instant on visualise sa communauté (ou celle d'un autre) :

 
Ce n'est pas tout. En cliquant sur See Interactive Flash Wheel, FriendWheel permet d'isoler le réseau particulier d'un friend, c'est-à-dire afficher ses connexions propres avec certains autres de vos friends, comme on peut le voir dans l'animation ci-dessous:





Chaque fois que la souris passe sur un nom de friend, ses propres friends sont reliés à lui par un segment. De plus, apparaît un chiffre en regard du nom. Par élimination des autres hypothèses, j'ai conclu qu'il s'agissait du nombre total de friends que nous avions, lui et moi, en commun. Il peut être supérieur au nombre de segments affichés car FriendWheel se limite toujours à 100 friends dans sa roue, et bien entendu, j'en ai beaucoup plus ... ;-).

La vidéo a été réalisée et est hébergée en ligne par ScreenToaster

06/05/2009

Chartle.net : service gratuit de création de diagrammes et cartes interactives

Dans deux messages récents, j'avais abordé le sujet du services de cartes et diagrammes fourni par Google à insérer dans un blog ou une page web. Nous avions pu voir que la syntaxe à respecter était assez complexe et la mise au point relativement douloureuse.
Chartle.net se charge de rendre les Google Chart Api accessible à tout le monde. Ce service a pour cela créé une interface de saisie des paramétres de la carte ou du diagramme avec visualisation du résultat en permanence, et gère la saisie des données à afficher. Un effort a été fait au niveau des légendes, sans lesquelles un camembert ou autre graphe n'atteindrait que rarement son but.
Le service fournit évidemment le code final à insérer. Dommage que ce ne soit pas le code original de Google, mais évidemment l'utilisateur ne retournerait jamais sur Chartle...
Voici quelques exemples tirés de la galerie :

04/05/2009

Conversion de fichiers pdf vers excel




Create, convert & edit PDF documents ? Nitro PDF Software
 met en ligne gratuitement un service de conversion de fichiers pdf vers xls, c'est-à-dire vers le tableur excel de Microsoft, version 2003 maximum. Ce service est actif depuis le 27 avril et est en beta. Un blog et un fil RSS sont disponibles pour suivre la progression de cet outil. 



 
Ce dernier vient s'ajouter à une toolbox gravitant autour du format PDF :

Edit PDF
PDF to Word
Create PDF


Pdftoexcelonline

Service de représentation graphique de schemas electriques simples

Voila un service en ligne sobre et élégant, permettant aux apprentis-électriciens de se faire une idée précise d'un schéma électrique avant de passer à la phase concrète de mise en production. Le look fait un peu penser aux Yahoo Pipes,  car développé avec Flexwires, ce qui n'est pas pour me déplaire. Il faut quand même connaître les symboles de base courants d'un schéma électrique classique, et ensuite par glisser-déposer, on transfère les objets dans une sorte d'éditeur.
Pas de stockage de données en ligne, pas d'impression de schéma, il s'agit plus d'un jouet que d'un véritable outil, cependant son esthétique en fait un gadget à vocation pédagogique.
N'essayez surtout pas de mettre en pratique le schéma ci-dessus, car c'est comme ça qu'arrivent les accidents. ;-).

03/05/2009

Api ebay regex yahoo pipes et bibliophilie sont dans un bateau

Des objets de collection aux voitures, vous pouvez acheter et vendre toutes sortes d'objets sur eBay 
Petit exercice de style pour extraire d'ebay-France les livres anciens antérieurs à 1800. Pour cela, j'ai utilisé un Yahoo Pipe appelé Ebay Search que j'ai modifié car il s'intéressait aux disques sur ebay US. Dans l'extrait ci-dessous j'ai surligné les champs modifiés :
La version originale comprenait un filtrage sur un mot contenu dans le titre, en saisie facultative.
Il a fallu ensuite rajouter autre un filtre permettant d'éviter les ouvrages postérieurs à 1799 et le tour était joué.
J'ai bien sur laissé ce Yahoo Pipe en libre copie à cette adresse.
Enfin, on peut diffuser le résultat entre autres sur une page personnalisée Google, sous l'appellation badge  (google gadget) comme illustré ci-dessous :