Bruger:Byrial/Offline rapporter

Fra Wikipedia, den frie encyklopædi

Jeg laver offline analyser af databasedump. Til dette formål importerer jeg databasedump til en MySQL-database som bruges af C-programmer som jeg laver til formålet.

Tidligere importede jeg XML-dumpene til databasen med MediaWiki, men den danske Wikipedia er blevet for stor til det (det vil nu tage adskillige dage at lave en fuld XML-import på min gamle pc), og det gav desuden nogle problemer med de danske navnerumsnavne. Så nu bruger jeg i stedet SQL-dumpene direkte.

Faste rapporter[redigér | rediger kildetekst]

Udgåede rapporter[redigér | rediger kildetekst]

Ad hoc-rapporter[redigér | rediger kildetekst]

Pt. ingen. Ønsker modtages gerne.

Status[redigér | rediger kildetekst]

  • 23. maj 2009: Databasedumpningen kører stabilt med et nyt dump ca. hver 5.-6. dag. Og jeg har endelig fået skrevet et program til at læse wikiteksten fra XML-filerne i dumpene. Så nu er det gamle ønske om at udelukke henvisninger fra skabeloner i Wikipedia:Mest ønskede artikler endelig igen opfyldt.
  • 5. maj 2009: Så kom endelig første databasedump efter 4. februar. Nu er der endelig kommet fart i dumpningerne igen, og med nuværende hastighed vil dumpene komme hver 5. dag.
  • 25. februar 2009: Al databasedumpning var stoppet i perioden 12.-24. februar. Dumpningprocessen er nu startet igen, men med store wikipediaer (en:, de:, fr:) som tager lang tid at behandle. Derfor vides det ikke hvornår der kommer et nyt dansk dump, men det bliver nok tidligst i midten eller slutningen af marts.
  • 7. februar 2009: Jeg er tilbage efter over et års pause.

Forslag[redigér | rediger kildetekst]

Jeg modtager meget gerne forslag til forbedringer af eksisterende rapporter og til nye rapporter på denne sides diskussionsside eller på diskussionssiderne for de enkelte rapporter.

Ting som jeg overvejer/arbejder med[redigér | rediger kildetekst]

  • Tjek af interwiki-sproghenvisninger:
    • Findes målet? Er det omdirigeret? Har målet selv sproghenvisninger som mangler? Har målet selv sproghenvisninger som er i konflikt med vores?
    • Er der andre sider i andre wikier som har sproghenvisninger hertil (eller til vores målsider)?
  • Tjek af kategorier: Hvis en kategori har sproghenvisninger til andre wikier, og hvis medlemmerne i den anden wikis katagori (eller underkategorier) har sproghenvisninger hertil, er det så til medlemmer af kategorien (eller af underkategorier)?
  • Tjek af taksabokse: Er der konsistens mellem taksobokse og lister over enheder i næste undernivau? Eksempel: Hvis en artikel for en familie har en slægtsliste, er artiklerne om de enkelte slægter så enige i at de tilhører den pågældende familie?

Se også[redigér | rediger kildetekst]

Programmer[redigér | rediger kildetekst]

Jeg laver mine rapporter med hjemmelavede programmer skrevet i C99. Det er for omfattende at bringe dem her, især fordi de ændres løbende. Interesserede kan få dem tilsendt under GPL-licensen.