Identifiants personnels


Moi ... Moi ... et re Moi
« [UBUNTU] Compiler Flvtool2   Informatique  [SPIP] Spip.ici.ous »

html vers RSS

mardi 12 septembre 2006, modifié le 23 octobre 2006, par Quentin Drouet

Je suis un grand fan de la technologie RSS...

Il y a plusieurs sites qui m’intéressent et qui ne proposent pas de feed que je peux lire dans mon aggrégateur...

J’ai cherché une manière de faire pendant longtemps et je suis tombé en bout de course sur ce site : http://feed43.com/ qui me dit en 2/3 mots :

"T’inquiète mon gards, je m’occupe de tout pour toi"...

Donc je me dis : "Génial... Allonz y mon nouveau pote, on va faire du bon boulot tous les 2"...

1er avantage : la gratuité ... de toute facon de nos jours, tous ces services de la vague 2.0 sont gratos...

2ème : Sans enregistrement... Tant mieux un mot de pas de moins à retenir... même si je change rarement...

Le fonctionnement est assez simple :

Etape 1 : cocher la case d’acceptation des conditions...

Etape 2 : Entrer la page dont on souhaite réaliser l’aggrégation / + 1 click de souris sur reload.... Jusque là tout le monde peut y arriver...

Etape 3 : Là ca se complique un petit peu :
- Il faut analyser comment la page est conçue afin de définir la partie de la page où sont situés les éléments les éléments qui nous intéresse... Pour ce faire, je ne saurais trop vous conseiller l’utilisation de l’extension View Source Chart 2.0 pour firefox.
- Dans mon essai les éléments intéressants étaient entre les 2 balises normales qui constituent une liste : <ul></ul>.
Donc il faut lui dire gentiment de prendre en compte uniquement ce qui se trouve dans cet espace... Je mets donc dans le champ "Global Search Pattern" l’espace de la page où se trouvent la liste des éléments que je veux : <ul>{%}</ul> où "%" veut dire "tout ce qui est compris entre".

Etape 4 : Maintenant on va séparer les différentes parties de cet espace présélectionné qui correspondront aux alertes de notre aggrégateur. Elles se définissent dans le champ "Item (repeatable) Search Pattern".
Après une analyse du code un peu plus approfondie, je peux voir que chacune des parties qui m’intéressent sont entre des balises <td width="284"></td>. Pour résumer il faut que mon aggrégateur me signale un nouvel article lorsque il rencontre un nouveau couple de ces balises... De plus, nécessaire pour plus tard où je vais avoir besoin de définir le titre de chaque item, je rajoute le fait que le titre se trouve entre les balises <big></big>, le texte, se trouve entre les balise <h3>et </h3>
Il faut donc mettre quelque chose qui ressemble à ceci dans le champ : <td width="284"{*}<big>{%}</big>{*}<h3>{%}</h3>{*}</td>

En gros cela signifie : Mon item commence à "<td width="284" ", tout ce qui se trouve avant big, on s’en fout (matérialisé par "{*}"), ma première partie récupérée est entre les balises "<big>" (matérialisé par "{%}"), ce qu’il y a derrière cette partie, on s’en fout jusqu’à la balise <h3> qui contient la seconde partie que je souhaite récupérer, et après </h3> jusqu’à la fin du <td>, en s’en fout à nouveau.

Etape 5 : On clique sur "Extract" et, miracle il nous trouve X résultat dans la page... Si vous avez 0 ou 1 c’est qu’il y a un problème ou alors que vous n’avez pas bien compris à quoi sert le RSS.

Etape 6 : On dispose de 3 champs pour définir plus précisément les propriétés de notre futur fil RSS tels que :
- Changer son titre
- Changer l’URL vers lequel il pointe
- Changer sa description.

Etape 7 : 3 nouveaux champs pour définir plus précisément la présentation de chaque item de ce fil :
- "Item Title Template" : on veut voir le titre que l’on a extrait précédamment. C’est le premier élément de chaque item extrait. Cela donne donc "%1" dans le champ.
- "Item Link Template" : comme chaque item ne renvoit pas vers une page différente, je mets ici l’URL de la page.
- "Item Content Template" : on veut voir le contenu textuel que l’on a extrait précédamment. C’est le second élément de chaque item extrait. Cela donne donc "%2" dans le champ.

Etape 8 : On clique sur preview et si on n’a pas fait d’erreur auparavant, on doit voir le résultat.

Etape 9 : Enfin, las but not least, on copie le lien qui nous est fourni par feed43 et on le colle dans notre aggégateur. Pour cet exemple, cela me donne ceci : http://feed43.com/the-kitchen-prog.xml

Note :
- Il est encore possible de modifier son apparence par la suite, un lien est fourni pour ce faire.
- Il est possible de l’ajouter à un compte que vous pouvez créer...
- Il est possible de modifier l’adresse du lien.

Voila ... C’est fini... Cela peut sembler complexe mais ne l’est pas tant que cela ... On peut y arriver en à peine 10 minutes...

P.-S.

D’autres possibilité citées dans ce post : http://darkam.com/forum/viewtopic.php?p=44864

Répondre à cet article


commentaires fermes
Propulsé par : SPIP 2.1.26 SVN [21335]