# GS_inst.pl
# Udtrækker resume-data for GS-overigter over ansatte ved en institution, eller forskere med et keyword som "interesse"
use strict;
use warnings;
my $file = $ARGV[0];
open(INPUT, $file) or die("Input file $file not found.\n");
my $output = $ARGV[1];
open(OUTPUT, '>'.$output) or die "Can't create $output.\n";
open TEMP, "+>temp2.txt" or die $!;
print OUTPUT "X00: GS-link\nX01: Navn\nX02: Affiliation\nX03: email-slut\nX04: Keywords\nX05: Times cited\nXXX: \n\n";
while(my $line = ) {
$line =~ s|\n| |ig; #erstat linieskift med blanktegn overalt i input-fil
$line =~ s|\t| |ig; #erstat TAB med blanktegn overalt i input-fil
$line =~ s|(.*?)|\nX04: $2;|ig; # Keywords - gør det muligt senere at lægge en XXX-slutkode i bunden af hver post
print TEMP $line; }
close(TEMP);
open(TEMP2, ") {
$line2 =~ s|.*?
||sig;
$line2 =~ s|
(.*?)|\n\nX00: https://scholar.google.dk$1\nX01: $2\n|ig; # GS-link og navn
$line2 =~ s|
(.*?)|\n\nX00: https://scholar.google.dk$1\nX01: $2\n|ig; # GS-link og navn
$line2 =~ s|