Top articles

  • XML et CSS.

    13 février 2009

    Ci-dessous notre première page XML. La feuille de style CSS est en rouge :

    Mon premier document XML

    Mon nom est nassim ...

  • Etiquetage avec Treetagger (ligne de commande)

    18 février 2009

    Voici le résultat obtenu avec Treetagger qui se trouve dans la BAO2 : ($perl ./cmd/tokenise-fr.pl fichierentrée.txt | ./bin/tree-tagger.exe ./lib/french.par -lemma -token -sgml > fichiersortie.txt). # Parmi PRP parmi les DET:ART le nouvelles ADJ nouveau...

  • Feuille de style xsl

    19 mars 2009

    Voici notre feuille de style xsl: ...

  • XML : RSS (Perl)

    11 mars 2009

    Nous présentons ci-dessous notre dernier script qui intègre à la fois l’étiquetage (BAO2) et le filtrage avec la bibliothèque XML : RSS de perl. Ce module remplace la ligne de filtrage qui utilise une expression régulière ([^<])+<\/description>....

  • Feuille de style xsl pour Firefox

    24 mars 2009

    Voici la feuille de style xsl pour afficher l'extraction de patrons sur FIREFOX :

  • Sortie -cordial- NOM ADJ

    07 avril 2009

    #/usr/bin/perl # use locale; force le \w à prendre les accentués. open(FICCORDIAL, "$ARGV[0]"); open (OUT, ">sortiepatrons.txt"); #i=0;#new (facultative) car en perl on a pas besoin d'initialiser le compteur, car perl initialise par défaut à =0.**** #$compt=1;...

  • Bienvenue !

    11 février 2009

    Voici le premier article de notre blog qui sera consacré au cours « Programmation et projet encadré - 2ème semestre - Plurital ». Nous présenterons dans ce blog toutes les évolutions de notre script. Ce dernier nous servira à extraire, à partir d’un an...

  • Extraction de patrons (rubrique technologies - 1 an - regexp)

    19 mars 2009

    Nous avons extrait des patrons NOM ADJ à partir de la rubrique : technologies. La sortie de la BAO2 que nous avons obtenue avec Treetagger a été éditée avec "cooktop". Nous avons d’abord utilisé la console XPATH de "cooktop", afin d’avoir une première...

  • EXERCICE 1 (saintex.xml) - TP Documents structurés.

    28 février 2009

    Voici le premier excercice du TP "documents structurés". Nous avons placé l'attribut "loc" de la balise phrase dans la balise paragraphe (remonter d'un cran ou d'un niveau dans l'arborescence hiérarchique), car nous avons trouvé dans tout le fichier saintex.xml...

  • Extraction de patrons : Cordial + script Perl.

    29 mars 2009

    Nous avons commencé à extraire le patron NCFS ADJFS à partir de la sortie .cnr étiquetée avec "Cordial". Nous présentons dans un premier temps la sortie étiquetée. Notons que les trois colonnes de cette sortie sont séparées par un "\t" et que la ponctuation...

  • Résultats BAO3 avec la console XPATH de COOKTOP

    19 mars 2009

    Dans un premier temps, nous utilisons la fonction "values:" puis la fonction "nodes:".