Tutorials

Hvordan "skrape" data i R?

Datamaskiner elsker å gjøre den samme tingen mange ganger. Det er fint, for da kan R gjøre unna det kjedelige arbeidet, mens jeg gjør andre ting. Automatisert datainnsamling er ikke vanskelig, men det kan være en tålmodighetsprøve. Så lenge informasjonen vi er ute etter er strukturert med tekst eller i en html-liste, vil vi kunne fortelle en datamaskin hvordan dataene skal hentes ut og sorteres. Skraping er stordriftsøkonomi. Det krever en del tid å finne datastrukturen, men når dette er gjort, kan vi sette R til å jobbe for oss.

What GLM should I choose?

How can I choose the best (parsimonious) description of my data? Here is my mental map of choice criteria when I consider what Generalized Linear Model (GLM) to rely on. Let's assume I want to describe the relationship (β) between an independent variable (x) and a dependent variable (y) in the form of: y = α + βx + ε Let's furthermore assume that the ideal description is not only parsimonious (i.