Issue #1766 resolved
Robert Jäschke
created an issue

Hi Hagen,

Siehst Du eine Chance, hierfür leicht einen Scraper zu bauen? Falls nicht, lassen wir das hier mit niedriger Priorität mal drin.

http://www.phcogres.com/article.asp?issn=0974-8490;year=2009;volume=1;issue=4;spage=172;epage=174;aulast=Shuge;t=6

Comments (16)

  1. Anonymous

    Commented by hks: Habe PharmacognosyResearchScraper hinzugefügt, eine Erweiterung des CitationManagerScrapers. Das Problem ist dabei das unvollständige BibTeX, das der Server zurückgibt (es fehlt der Typ bis hin zum Key):

    author = {Dongqing, An. and Shuge, Tian. and Tao, Yang. and Fan, Zhang. and Xiaoying, Zhou.}, title = {{Essential Oil Composition of the <i>Dracocephalum moldavica </i>L from Xinjiang in China}}, journal ={Pharmacognosy Research}, volume ={1}, number ={4}, pages = {172-174}, year = {2009}, abstract ={The essential oil of Dracocephalum moldavica L from Xinjiang in China was isolated by hydrodistillation in yield of 0.15 %(w/w). The chemical composition of the essential oil was analyzed by GC and GCMS. Fifty-one compounds accounting for 99.45% of the total oil were identified. The major components werea-Citral (32.55%), &#946;-Citral (23.53%), Acetic acid, geranial ester(21.32%), Trans-Geraniol(3.38%), Nerolacetate(3.38%), Octane(2.14%), and 2,4,6-Trimethyl -3-cyclohexene-1-carboxaldehyde (1.3%). Monotenepers were the main group of compounds.}, URL ={http://www.phcogres.com/article.asp?issn=0974-8490;year=2009;volume=1;issue=4;spage=172;epage=174;aulast=Shuge;t=6}, eprint ={http://www.phcogres.com/article.asp?issn=0974-8490;year=2009;volume=1;issue=4;spage=172;epage=174;aulast=Shuge;t=6} }

    Ich habe dies bereits dem Verantwortlichen Herausgeber mitgeteilt.

  2. Anonymous

    Commented by lhanke: Ich hab mich darum noch nicht gekümmert. Soll ich das höher priorisiert angehen?

  3. Anonymous

    Commented by lhanke: Also, das Problem ist, dass das BibTex, was von der Seite ausgegeben wird nicht korrekt formatiert ist und dadurch der BibTexParser nicht parsen kann. Wir könnten mit den Betreibern Kontakt aufnehmen, um ihnen mitzuteilen, dass ihr Export kaputtes BibTex ausgibt. Ich könnte auch einen allgemeinen "Repairer" für BibTex schreiben (im Sinne eines Converters, der versucht, auf Basis der vorhandenen Felder das BibTex zu komplettieren (vielleicht allgemein nciht schlecht ...)). Oder ich würde eine abstrakte preprocess Methode in den CitationManagerScraper einbauen, über die dann explizit BibTex von der Seite vorher aufbereitet werden kann (vermutlich die schlechteste Vaiante).

    Allgemein sieht das kaputte BibTex so aus: "author = {Dongqing, An. and Shuge, Tian. and Tao, Yang. and Fan, Zhang. and Xiaoying, Zhou.}, title = {{Essential Oil Composition of the <i>Dracocephalum moldavica </i>L from Xinjiang in China}}, journal ={Pharmacognosy Research}, volume ={1}, number ={4}, pages = {172-174}, year = {2009}, abstract ={The essential oil of Dracocephalum moldavica L from Xinjiang in China was isolated by hydrodistillation in yield of 0.15 %(w/w). The chemical composition of the essential oil was analyzed by GC and GCMS. Fifty-one compounds accounting for 99.45% of the total oil were identified. The major components werea-Citral (32.55%), &#946;-Citral (23.53%), Acetic acid, geranial ester(21.32%), Trans-Geraniol(3.38%), Nerolacetate(3.38%), Octane(2.14%), and 2,4,6-Trimethyl -3-cyclohexene-1-carboxaldehyde (1.3%). Monotenepers were the main group of compounds.}, URL ={http://www.phcogres.com/article.asp?issn=0974-8490;year=2009;volume=1;issue=4;spage=172;epage=174;aulast=Shuge;t=6}, eprint ={http://www.phcogres.com/article.asp?issn=0974-8490;year=2009;volume=1;issue=4;spage=172;epage=174;aulast=Shuge;t=6} }"

  4. Anonymous

    Commented by lhanke: Unten im Kommentar ist das Problem bereits einmal erwähnt worden. (Habe ich überlesen) Also hat der Betreiber der Seite wohl seit Anfang des Jahres dieses Problem nicht gelöst, womit als Lösungsmöglichkeiten aus meinen Vorschlägen wohl nur noch der zweite und dritte übrig bleiben.

  5. Robert Jäschke reporter

    Hi Lukas,

    So allgemein war bisher die Idee, BibTeX, EndNote, etc. nicht generisch zu reparieren (weil die Gefahr besteht, dass das dann nicht richtig funktioniert und dann gleich /alle/ Scraper betroffen sind), daher wäre ein Repairer speziell für diesen Scraper am besten. Da das wegen der Superklasse CitationManagerScraper nicht so einfach geht, läuft das auf das Preprocess hinaus. Hhmmm.

  6. Anonymous

    Commented by lhanke: Allerdings würde es doch mehr Sinn machen den Repairer auszulagern und nur für diesen Scraper zu benutzen oder? Der sollte dann quasi nicht grundsätzlich in jedem Scraper verwendet werden, sondern dient lediglich als wiederverwendbare, allgemeine Lösung, auf die erstmal nur z.B. die erwähnte preprocess Methode des CitationManagers zugreifen würde.

  7. Log in to comment