27/04/2009

Google Labs : Similar Images ou la recherche d'images similaires

Vu que je suis bougon aujourd'hui, je commencerai par une critique : pourquoi ne pas chercher une image en saisissant le chemin et le nom d'une image locale ou par une adresse web ? En définitive le premier geste à effectuer pour trouver une image reste encore et toujours de saisir un mot. L'approche reste sémantique, alors qu'elle devrait être purement visuelle, presque subjective : je veux des images avec telles formes et/ou couleurs générales, je n'ai pas forcément envie de la baptiser ou d'écrire tour Eiffel, hirondelle ou papillon.
Cette critique est tellement fréquente dans les Comments de Google Labs , qu'il est inutile d'y rajouter une french touch.
A part cela, l'idée elle-même est novatrice et ouvre la porte à une infinité de filtres de recherches de formes et de couleurs. Halte aux discours et place aux exemples.
Dans les tests ci-dessous je me suis employé à m'éloigner de l'image d'origine, ce qui à priori, est contraire à une démarche normale, mais à posteriori non car je n'arrivais vraiment pas à me dégager de la planète ;).
Voici le fruit d'un butinage à partir de la photo de la Terre, fournie par Google Labs à titre de démo dans la rubrique 'Space', chaque image étant le résultat d'un choix dans les résultats précédents :


Première observation : il ne semble pas y avoir d'ordre décroissant de pertinence au sein d'un même ensemble de résultats.
Seconde : l'algorithme repère correctement les forts contrastes ainsi que les formes simples.
Troisième : repérage de l'inclusion d'une image dans une autre, mais négligence totale du reste de l'image résultat : la seule présence de l'image de départ dans l'image trouvée, justifie la pertinence. Peut s'avérer utile.
Quatrième : pas d'OCR, c'est-à-dire de reconnaissance de caractères dans l'algorithme de recherche. Dommage.
Cinquième : le signifiant utilisé au départ : 'space' semble ne pas rentrer en ligne de compte dans la succession de résultats. Cependant il est curieusement conservé dans le bouton :
Cela implique forcément qu'il conserve une valeur dans l'algorithme car si on clique dessus on obtient une recherche d'images relatives à ce mot avec 247 000 000 résultats, alors que si on effectue la même recherche d'images (non similaires) en tapant normalement 'space', on obtient seulement 141 000 000 résultats.
Pair ailleurs j'a testé la saisie directe d'un thème de recherche, que, au vu des observations ci-dessus, j'ai voulu simpliste. J'ai cherché 'rond noir' . J'ai donc obtenu toutes sortes de ronds noirs pas tous ronds ni noirs, mais en tous cas aucun lien de type 'similar images' à l'horizon ! Ce qui se résume donc à une simple recherche d'images.
Par contre le terme 'chaussure' a fourni des croquenots de toutes sortes et souvent flanqués du lien justifiant le présent billet.

Conclusion :
Là encore, Google fournit un outil à la fois pertinent et étrange, dont le moindre attrait n'est pas de chercher 'comment' il a été pensé.
A ce stade, je suis allé faire un tour sur le billet y afférent de TechCrunch, qui m'a seulement appris qu'on pouvait, de source autorisée, raisonnablement penser que Google ne se servirait pas uniquement d'un simple algorithme de reconnaissance de formes. Bien.
Il me vient une autre idée de test mais ce sera pour une autre fois : reconnaissance de visages. Si ça intéresse quelqu'un, j'apprécierai un retour d'infos.
Comme dirait mon psychiatre, on va s'arrêter là pour aujourd'hui.

Similar Images

24/04/2009

Construire un scanner pour les livres


DIY High-Speed Book Scanner from Trash and Cheap Cameras - More DIY How To Projects

Vu sur le site Instructables qui contient quantité de mode opératoires pour construire des objets utiles ou inutiles mais astucieux et à faible coût pour la plupart. Bien entendu le site est en anglais.

22/04/2009

Bibliophilie : les premiers incunables sur Google Maps

Lire un bouquin sur les incunables c'est bien, prendre des notes et les géolocaliser sur Google Maps c'est encore mieux. D'où l'exercice ci-dessous, appelé à s'étoffer au fil de la lecture.


Afficher Bibliophilie : les 1ers incunables sur une carte plus grande

La carte étant appelée à évoluer, voici le lien RSS pour se tenir informé des ajouts.
RSS

20/04/2009

Hadopi : exemple de courrier type a expedier a son depute



Je fournis ci-dessous  un exemple de courrier destiné à nos députés et néanmoins législateurs. Chacun a le droit voire le devoir de le modifier, l'amplifier et surtout l'étayer. Quelques points sont faiblement argumentés et même discutables, mais il faut faire concis, ne pas ennuyer et moins chercher à convaincre qu'à réveiller le démocrate qui parfois somnole au fond de nos élus. Bien entendu, mon exemplaire est déjà parti et miracle, mon abonnement internet fonctionne toujours ;-).


Monsieur le député,


Permettez-moi de vous inviter à réfléchir aux conditions discutables de conception et d'application de la loi dite Hadopi et à ses conséquences en définitive néfastes pour la création artistique et les libertés individuelles.

Conception de la loi :
Elle est, de notoriété publique, dictée par les grandes entreprises de la production, édition, et distribution multimédia. Celles-ci prétendent en premier lieu protéger les auteurs, mais en réalité elles protègent leur propre industrie, ce qui est compréhensible, bien qu'hypocrite, et ceci expliquant cela, est en réalité un combat d'arrière-garde, ignorant le combat d'un vrai entrepreneur qui serait de chercher d'ores et déjà d'autres modèles économiques.

Application de la loi :
D'un point de vue juridique, cette loi bafoue la présomption d'innocence et confère à des entreprises privées un droit de police et de justice sur les citoyens.
En effet, elle nécessitera l'installation sur chaque ordinateur d'un outil de contrôle des flux de données qui est une atteinte caractérisée aux libertés individuelles.
La moindre des données présentes sur votre disque dur ne sera plus en sécurité.
Enfin la sanction éventuelle sera donnée par une entreprise privée sans que l'Etat français, garant des droits du citoyen, ne puisse intervenir à ce stade.

Néfaste pour la création artistique :
Citation de l'écrivain francophile brésilien Paulo Coelho : 'Depuis que mes œuvres littéraires sont en téléchargement gratuit sur le Net, mes ventes ont augmenté.'
Le contenu téléchargé est rarement de bonne qualité.
Il est donc généralement plus proche d'une clientèle spécialisée en quête d'exploit que de véritables amateurs.

Monsieur le député, les modèles économiques qui régissent les industries multimédia sont en pleine métamorphose. Seules les jeunes maisons aux structures souples et réactives sauront négocier ce nouveau défi, et se positionner en vrais défenseurs de la création. Monsieur le député, si cette loi est adoptée, vous aurez de plus en plus de lobbyistes qui hanteront les couloirs de l'Assemblée Nationale et qui porteront la parole de telle corporation frustrée par une concurrence effrénée.
Ces gens-là ne remplaceront jamais vos électeurs.

Vous remerciant de m'avoir lu jusqu'ici et souhaitant avoir contribué à vous éclairer, je vous prie d'agréer, monsieur le député, l'expression de mes salutations.

18/04/2009

Microsoft Live Search Translator add-on pour Office 2003 et 2007

microsoft officeMicrosoft vient de mettre à disposition des utilisateurs d'Office 2003 et 2007 Live Search Translator, moteur de traduction. Basé sur WindowsLiveTranslator, service lui-même construit à partir de Windows Live Search Translation et celui-ci à partir de Windows Live Search, (respirer ici), WLT viendra se placer comme une alternative à WordLingo, tout en conservant celui-ci disponible aux utilisateurs.

Il faut comme d'habitude télécharger l'installateur idoine chez Microsoft pour obtenir ce nouveau moteur, et l'exécuter en local. En fait l'installateur ne fait qu'une chose, c'est placer WLT par défaut dans Office. Le téléchargement est donc instantané.

Un clic sur le bouton Traduction dans l'onglet Révision (Office 2007), traduira automatiquement tout texte sélectionné dans un document et affichera le résultat dans la fenêtre de recherche de Word comme ceci :



Lors de mon installation, je me suis retrouvé avec la paire de langues par défaut Anglais/Allemand. Comme indiqué ci-dessus par les 2 flèches rouges de droite, la rectification est rapide.

Voici un exemple, basé sur le texte de l'article de Ghacks dont le présent billet est inspiré :

Texte de départ :


To install Microsoft Translator download the installer from the Microsoft website and execute it on a local computer system. Make sure Microsoft Office is closed during the installation. The installer will then add Microsoft Translator as the default Office translator automatically for the languages that are supported by it.

Résultat dans Word 2007 avec Live Search Translator :

Pour installer Microsoft traducteur télécharger le programme d'installation à partir du site Web de Microsoft et l'exécuter sur un ordinateur local. Assurez-vous que Microsoft Office est fermé pendant l'installation. Le programme d'installation sera ensuite ajouter traducteur Microsoft comme le traducteur d'Office par défaut automatiquement pour les langues prises en charge par elle.

Comme on peut le constater, cela est imparfait, mais le sens général est perceptible (d'un autre coté, ce n'était pas du Shakespeare).

Galerie Google Earth

 
Sur ce site, le lecteur trouvera une mine de fichiers téléchargeables gratuitement et intégrables à Google Earth, contenant par exemple :

La densité de population mondiale
La consommation mondiale d'essence
Un atlas géologique des Etats-Unis
Les sites de la Rome antique
Une animation simulant la montée des eaux dans le monde
Les séismes en 'temps réel' (plutôt en léger différé)
Visualisation des radiations émises lors de l'accident de Tchernobyl
Le calendrier 2009 du Championnat du monde FIA de formule 1.
Animation sur notre système solaire
Base de données d'orbites de satellites

Et bien d'autres choses encore. Ce site n'est pas récent, mais il contient une mine d'informations diverses dans un style tellement ludique, qu'il est bon d'en rappeler l'existence.

Cela va sans dire (mieux en le disant , etc ..) il est nécessaire d'avoir installé Google Earth pour faire fonctionner ces animations.

16/04/2009

Expressions regulieres : logiciel de test et exemples

Merci à Ghacks de nous avoir fourni le lien vers The Regex Coach, un freeware développé en Lisp, qui permet tests et mise au point des expressions régulières.
Petit rappel, les expressions régulières ou regexp ou encore rationnelles, regroupent un ensemble de conventions syntaxiques reconnues par plusieurs langages de programmation et permettant de rechercher dans une chaîne de caractères la présence d'une ou plusieurs autres chaînes.
Plutôt que de longs discours, des exemples :
Détection d'une date dans un texte, composée d'une suite de deux chiffres, puis deux chiffres puis quatre chiffres :
.*([0-9]{2})([0-9]{2})([0-9]{4}).

On voit dans l'écran ci-dessus que la première séquence de 4 chiffres est soigneusement évitée car isolée, et que seule la séquence de 4 immédiatement précédée de 2 X 2 chiffres est détectée. La seconde flèche rouge nous indique en outre qu'il s'agit de la troisième occurence de chiffres recherchée dans la présente expression.
Détection d'un Url dans un texte :
http://[\w.%/?=&#:;+-]{5,}net|com
Dans l'écran ci-dessus, on détectera uniquement le premier Url de type com ou net rencontré dans le texte soumis.
La syntaxe gérée par ce freeware pour les regexp est celle de Perl et plus particulièrement des toolkits 
PCRE et CL-PPCRE. Se méfier par contre de la syntaxe Java, compatible à 99% ...
La compatibilité Perl le rend utilisable par les développeurs Python ; Php entre autres. Par acquis de conscience on peut faire une contre-vérification sur le site annuaire-info.com qui permet de tester en ligne une expression régulière Perl et qui est en français, lui ;-).
The Regex Coach permet aussi notamment d'effectuer des remplacements automatiques de chaînes dans des textes importants. Maximisation de la fenêtre et des champs sont bien sur possibles.

13/04/2009

Chagos : des iles perdues dans l ocean indien


Agrandir le plan
Pas perdues pour tout le monde, puisque la seule activité de l'ile principale est constituée d'une base militaire américaine. 4000 militaires britanniques, états-uniens, et civils majoritairement asiatiques, à l'exclusion des Chagossiens autochtones, y travaillent. Cette ile est connue sous le nom de Diego Garcia.
Un peu d'histoire : contrairement aux Maldives, 500 kms plus au nord, l'archipes des Chagos n'a pas connu de peuplement ancien. Ce sont des colons français et bien sur des esclaves qui le peupleront aux alentours de 1776. Les iles sont rapidement réclamées par la Couronne Britannique. Entretemps, l'esclavage est aboli, et suite aux tractations entre les gouvernements, les Chagossiens perdent leurs titres de propriétés sur leurs propres iles...et sont expulsés en 1965 !
Enfin, les iles sont louées pour 50 ans par les Anglais aux Etats-uniens, en échange d'une forte réduction sur des achats de missiles Polaris. On est vraiment peu de choses.
Les Chagossiens exilés notamment aux Seychelles réclament le droit au retour, obtiennent bien qu'ils le contestent, des compensations financières, sont en procès avec les Etats-Unis, les Britanniques. Aujourd'hui, La Haute Cour de justice de Londres leur a octroyé ce droit, mais le gouvernement et la Reine s'y opposent. 
Sinon comment auraient fait les Américains pour bombarder l'Afghanistan sils n'avaient pas eu Diego Garcia ?
A noter que la démocratie c'est bien, mais couronnée par une Reine c'est encore mieux : quand celle-là  a des limites, on se replie sur celle-ci et les Décrets Royaux, et là  tout fonctionne. Cela s'appelle le néo-colonialisme.
Cerise sur le gâteau : l'ile Maurice s'y met aussi et réclame la souveraineté sur cet archipel, en promettant bien sur, aux 8000 Chagossiens qu'ils reprendront possession de leur terre.
Quelques liens :

06/04/2009

Seismes et recuperation des donnees


Le grave séisme qui s'est produit ce matin à 03h30 heure locale dans les Abruzzes italiennes m'amène à effectuer une investigation des outils informatiques destinés à synthétiser ce type de données et accessibles au grand public.
Par exemple, le BRGM : Bureau de Recherches Géologiques et Minières, à travers son site spécialisé SisFrance fournit des tableaux et des cartes dont les représentations sont
privées et gratuites effectuées exclusivement dans un cercle de famille.
Dans le cas de données tabulaires, après avoir sélectionné un département, on peut donc construire une liaison vers un document Excel, par exemple :


L'image ci-dessus est extraite d'Excel 2007 mais la fonction existait déjà dans la version précédente. Comme on peut le voir, dans le menu Données, cliquer sur à partir du Site Web, ensuite coller l'adresse de la page dans laquelle se trouvent les données. Excel détectera les tableaux et les marquera d'une flèche sur laquelle il faudra cliquer pour effectuer la sélection, puis importer. Le lien est conservé dans le document et un clic sur Actualiser tout le remet à jour (peut être reglé par le bouton Propriétés de la fenêtre Importer).
Les Yahoo Pipes peuvent également réceptionner ces données comme le montre l'image ci-dessous :
Cependant la mise en forme finale de ces données est nettement plus ardue, mais plus grande est la récompense, car le flux final peut être converti en RSS ; en PHP ; JSON ; et bien d'autres formats.

Un petit avantage d'Excel sur les Yahoo Pipes, est que le corporatif tableur sait parfaitement lire une page php et en extraire les données tabulaires voulues, alors que les Pipes non, mais ils font tant d'autres choses !

Dans un autre registre, et plus facilement accessible, penser au site américain de recensement des séismes : USGS qui fournit gratuitement sur sa page de téléchargement plusieurs fichiers de type kmz, lisibles par Google Earth et listant par exemple les secousses mondiales des 7 derniers jours triées par profondeur de l'épicentre, ou bien plus historique, la description du tremblement de terre de San-Francisco en 1906.