PURE - bibliografiske data

Alle danske universiteter og en del andre uddannelsesinstitutioner registrerer alle udgivelser i deres egen delbase i PURE.

De kan høstes af et Perl-program (VBN_pub_html.pl) gennem web-søgefladen med følgende URL'er:

Aalborg Universitet:

http://vbn.aau.dk/da/publications/search.html?advanced=true&showAdvanced=true&page=0&pageSize=500
http://vbn.aau.dk/da/publications/search.html?advanced=true&showAdvanced=true&page=1&pageSize=500

Godt 82.000 pubs - eller enkelte institutter:

http://vbn.aau.dk/da/organisations/institut-for-laering-og-filosofi(6dd4cb48-2bea-4180-8bae-46bc0a37ce38)/publications.html?page=0&pageSize=500

VBN_pub_html.pl udtrækker følgende datafelter - alle tags er 8 tegn lange incl. afsluttende kolon mellemrum:

NEW  : med eller uden tekst - alle poster skal begynde med dette delfelt
AU  : alle forfattere
DOI  : doi - hvis feltet gentages udtrækkes kun første forekomst
ISSN : issn - hvis feltet gentages udtrækkes kun første forekomst
LK_PUB: link til fuldtekst-dokument
PN  : 
PU  : 
PY  : trykkeår
REST : '
SO  : Tidsskriftnavn, bind, sidetal
STATUS: '
TI  : '
TY  : '
UUID : VBN/PURE-unikt fast ID-nummer
PT  : Publikationstype - alle poster skal slutte med dette delfelt

Filen kan konverteres til TAB-format med Bibliometry Toolbox delprogrammet VBN Tagged Split

Syddansk Universitet:

http://findresearcher.sdu.dk:8080/portal/da/publications/search.html?pageSize=500&page=0
http://findresearcher.sdu.dk:8080/portal/da/publications/search.html?pageSize=500&page=1

Godt 70.000 pubs

Københavns Universitet:

Institut + medarbejdernummer

http://www.ifsv.ku.dk/ansatte/?id=146327&f=3&pubcategory=&vis=medarbejder

Aarhus Universitet

http://pure.au.dk/portal/da/organisations/null(fa9d17d6-3d7c-43bf-93f7-a18c40cf0778)/publications.html?page=0&query=&pageSize=500

Godt 190.000 poster - brug søgeboksen til afgrænsning til fakultet eller institut og brug denne enheds uuid i URL'en istedet.

DTU

http://orbit.dtu.dk/en/organisations/department-of-chemistry(831a430c-5a0c-40d3-b6ee-cf70accc4109)/publications.html?pageSize=500&page=0

Vælg blandt institutter/centre: http://orbit.dtu.dk/en/organisations/list.html

PURE publikationstyper

Til bibliometriske analyser egner sig kun PURE's fulde/lange EXCEL-eksportformat sig. Desværre kan man ikke selv definere hvilke datafelter og i hvilken rækkefølge disse eksporteres, ligesom posterne indeholde et stort antal linieskift og tabulatortegn, der kræver en opretning af datasættet, hvis det skal anvendes udenfor det oprindelige EXCEL-ark.

De mulige datafelter er opregnet her - sorteret ud efter deres nødvendighed for at karakterisere de forskellige publikationstyper.

Oprensning af PURE-EXCEL-udtræk

Alle linieskift "inde i poster" fjernes: Find de egt. post-slut/start-linieskift vha. et af de "faste" datafelter først i posten, oftest feltet for "type", det kan ligge 1-10 felter fra post-start - hvis der er to (evt. tomme) datafelter før, brug

FIND:
[\r|\n|^](.*?)\t(.*?)\t(Forskning|Formidling|Undervisning|Rådgivning)\t

ERSTAT:
## \1\t\2\t\3\t

Medmindre andet er angivet, er indholdet af denne side licenseret under Creative Commons Attribution-ShareAlike 3.0 License