Extraction de données html avec Sed

vendredi 21 août 2015

Bonjour à tous,

J'ai un petit problème que je n'arrive pas à résoudre.

J'explique : J'ai un code html tout simple :

<tbody>
  <tr >
    <td type="Date">20/08/2015</td>
    <td attrib="Libelle">Ouverture</td>
    <td attrib="site" class="last">Centre 1</td>
  </tr>
  <tr class='last'>
    <td headers="Date">20/08/2015</td>
    <td headers="Libelle">John part à la peche</td>
    <td headers="site" class="last">Centre 2</td>
  </tr>
</tbody>
 

L'idée c'est d'extraire les données contenues dans les balises TD et de les mettre dans une variable tableau.

Voici ce que j'ai fait :



i=-1
mon_tableau=()

sed -n 's,.*<td .*>\([^>].*\)</td>,\1,p' /tmp/test.html | while read titre; do
        echo $titre
        i=`expr $i + 1`
        mon_tableau[$i]="$titre"
done

echo ${mon_tableau[*]}

 


Maintenant j'ai deux problèmes, le premier, c'est que les deux TD qui contiennent respectivement Centre 1 et Centre 2 ne sorte pas avec echo $titre... roll

Le deuxième problème, est que mon tableau, reste vide malgré que dans la variable $titre contiennent quand même les textes des autres TD ...


Une idée ??


Merci par avance.


Orsam



Extraction de données html avec Sed

0 commentaires:

Enregistrer un commentaire

 

Lorem

Ipsum

Dolor