Kaltix, une nouvelle
start-up formée par des membres du Stanford
Page Rank Project travaille sur un des problèmes les plus
épineux de la recherche sur le web : la personnalisation des
résultats en fonction de l'utilisateur.
Kaltix, a été fondé récemment (juin) par
3 membres du Page Rank Stanford Project. Ce groupe de travail d'étudiants
de l'Université de Stanford (qui a produit les fondateurs de
Google et de Yahoo!) vise à perfectionner l'algorithme du Page
Rank qui calcule l'importance des sites les uns par rapport aux autres
dans l'organisation des résultats de Google.(1)
Kaltix cherche notamment à accélérer le calcul
du Page Rank. L'un des buts de la société est de développer
des processus de personnalisation des recherches sur le web qui permettront
d'afficher des résultats adaptés à chaque internaute.
Kaltix a révélé peu de choses sur ses projets et
sa technologie, et ses responsables se
refusent pour l'instant à tout commentaires.
Le site Kaltix
est en préparation et le site du Page
Rank Project est depuis peu inaccessible.
Les fonctionnalités de personnalisation du web constituent un
enjeux crucial. Les tentatives actuelles n'ont pas répondu aux
attentes. Par exemple, Amazon.com met en valeur des titres de livres
aux internautes en fonction de leurs achats précédents,
ce qui n'est pas forcément pertinent.
Si les recherches sur la personnalisation du web aboutissent, cela pourra
aider des millions de personnes à mieux naviguer sur la web.
La personnalisation pourrait développer de nouvelles sources
de revenu en permettant aux annonceurs web de cibler plus efficacement
et d'avoir ainsi un retour sur investissement plus important. Le CA
de la publicité liée à la recherche pourrait atteindre
de 6 à 8 milliards de $ d'ici cinq ans.
"La
personnalisation est l'un des Saint-Graal de la recherche"
explique Chris Sherman, éditeur de Search Day. "Tout
le monde travaille à la personnalisation à un certain
degré ou à un autre. Aussi, les vraies questions sont
de savoir quand la technologie sortira des laboratoires et quelles applications
elle permettra".
La personnalisation des outils de recherche nécessite d'assortir
les résultats aux profils des utilisateurs. Ces profils pourraient
inclure des données comme le code postal, la date de naissance
ou l'historique de recherche. Par exemple, le mot-clé "jaguar"
pourrait entraîner l'affichage de sites automobiles dans les premiers
résultats de recherche pour quelqu'un qui a récemment
visité de tels sites et des sites animaliers pour quelqu'un dont
l'historique de surf a montré son intérêt pour les
animaux.
Les techniques
de personnalisation impliquent la collecte de donnés directement
issues de l'internaute tout comme la mise en place d'algorithmes pour
travailler "en coulisses".
Avec un peu d'infos données par l'internaute, un moteur peut
actuellement localiser la recherche et afficher ses résultats
en allemand ou en français. Une technique avancée d'algorithme
pourrait appliquer une analyse par mots clés afin d'analyser
l'historique de recherche pour deviner l'objet de la prochaine requête.
De nombreux
moteurs utilisent déjà des fonctions rudimentaires de
personnalisation.
Altavista
utilise une technologie de géotraking pour détecter l'adresse
IP des visiteurs et deviner leur localisation géographique. Cela
peut permettre d'afficher des résultats adaptés par exemple
sur la requête "football" pour un internaute du Royaume-uni.
Quant à
Yahoo!, il utilise les informations collectées auprès
de ses abonnés à son service mail notamment (code postal,
et autres données personnelles) pour personnaliser ses services
My Yahoo, sa météo ou les Pages Jaunes.
Google montre
aussi un vif intérêt pur la personnalisation. Il y a 2
ans, il a racheté Outride, une société spécialisé
dans le data-mining et l'analyse sémantique afin d'améliorer
les résultats de recherche.
Les 3 principales
firmes (Yahoo, MSN et Google) essaient activement de perfectionner les
techniques de recherche.
"Par
nature, c'est quelque chose qui doit être adapté à
chaque utilisateur individuel. Ce n'est pas comme si Google devait construire
un module de personnalisation et le brancher. C'est un effort plus complexe
qui requiert des investissements importants. Et il n'est pas encore
certain qu'il y ait suffisamment de demande justifiant de telles dépenses
"
explique Chris Sherman.
La tache
principale est d'obtenir la bonne interface utilisateur. Il s'agira
de lui notifier quels types de donnés ont été collectés,
où celles-ci sont stockées et comment elles vont être
utilisées. Cela implique aussi la possibilité pour l'internaute
de changer ou supprimer ces données.
La personnalisation
peut donc rebuter les gens si elle interfère et les gêne.
Bien que
Kaltix ait révélé encore peu de choses, la société
intéresse nombre de vétérans des moteurs de recherche.
Elle a fait des démonstrations auprès d'eux et notamment
auprès de Jan Pederson, Responsable R&D chez Altavista.
Pour l'instant,
les fondateurs de Kaltix ont publié des recherches qui montrent
comment calculer des résultats pratiquement 1.000 fois plus vite
que ce qui est possible en utilisant des méthodes actuelles.
(Voir "les
moteurs du futur")
Pitkow, d'Outride,
a expliqué que la méthode de Kaltix équivalait
à rechercher un arbre dans une forêt en examinant seulement
un groupe d'arbres plutôt que la forêt entière. "Si
vous pouvez focaliser vos calculs sur ce groupe d'arbres, alors vous
serez plus rapides. Le calcul du Page Rank prend des jours. Si vous
pouvez l'accélérer, alors vous pourrez l'adapter sur une
base individuelle".
(1)
Au sein de l'Université de Stanford, il existe plusieurs groupes
de travail issus des technologies de Google. Ainsi The
Stanford WebBase Project travaille notamment sur le crawling, l'indexation
et les requêtes.
|