Spletne urice \#153: Čiščenje divjih internetov

  • Swizec Teller
  • oktober 2010

Abstract

Kdorkoli je poskušal napisati parser za XML ali HTML, se zaveda kako divje je stanje na internetu. Ko hočemo poleg samega parsanja še izluščiti samo glavno vsebino člankov pa se lahko kaj kmalu zazdi, da se interneti norčujejo iz programerja. Ustanovitelj podjetja Preona, Swizec je predstavil zadnja tri leta poskusov na tem področju in kako je pri razvoju pametnga RSS bralnika prišel do izluščevalnika, ki je dovolj dober, da zamenja privzete vsebine iz RSS-ov.

Video všeč? Podprite nas! http://www.kiberpipa.org/sl/support/