Projektista:
- Projektin tarkoitus on selvittää, miltä osin MBnet Apajassa olleet tiedostot olisivat vielä löydettävissä. Katso myös projektin kuvausta etusivulta.
- Apajalista perustuu Wayback Machineen tallentuneiden Apajan www-sivujen tiedostolistauksiin. Koska Wayback ei ole tallentanut kaikkia sivuja, tuntematon osa nimikkeistä puuttuu.
- Koska Wayback-listaus on tallentunut useilta eri vuosilta, on osastojen kirjoitusasu saattanut muuttua, joka takia sama tiedosto on voinut olla useilla eri osastoilla. Osa näistä tuplariveistä on poistettu Apajalista-listauksesta.
- Apajalista-listaukseen on sittemmin yhdistettu 1/1997 virallinen purkkilistaus. Yhdistämisessä käytettiin tiedoston nimeä ja päivämäärää avaimina. Mikäli tuli osuma, kuvaus ja koko korvattiin 1997-listauksessa olevilla. Jos osumaa ei tullut, lisättiin uusi rivi. Tämä aiheutti paljon ns. tuplatiedostoja, koska sama tiedosto on voinut muuttaa esimerkiksi arkisto-osastolle vuosien saatossa.
- 10/1997 ja 11/1997 -listausten yhdistämisessä käytetty vähemmän kaoottista metodia. Ensin on pyritty löytämään vastaavat nimikkeet ja tuotu sama id-numero niille, jonka jälkeen tuotu pelkät uudet nimikkeet Apajalistaan. ID-sivuilla näkyy kaikkien listausten alkuperäiset tiedot yksittäisestä nimikkeestä.
Yleistä sivustosta:
- Sivusto on epäkaupallinen. Täällä ei ole mainoksia, eikä tietojasi myydä mihinkään. Palvelimen access.log -tiedostoon tallentuu käynnistä käyttäjän IP-osoite, selaimen versio, sekä mahdollinen referenssi miltä sivulta on tänne päädytty. Nämä ovat tietoja joita Nginx tallentaa oletuksena. Tiedot poistuvat itsekseen normaalin lokikierron mukana, eikä niitä luovuteta ulkopuolisille, tai käytetä missään ulkoisessa mainos- tai web-analytiikkapalvelussa.
- Ladattavat tiedostot ovat tarkistettu ClamAV -virustorjuntaohjelmalla. Mahdolliset löydökset näkyvät punaisella kommenttikentässä. Löydös saattaa olla myös väärä hälytys - omaa harkintaa sopii käyttää. Esimerkiksi vanhat pilailuohjelmat merkkautuu haittaohjelmiksi.
- Sivusto toimii myös ilman SSL-salausta, joten Apajalistaa voi selailla vanhoilla selaimilla kirjoittamalla osoiteriville http://apajalista.net (ei siis https).
- Etusivulla on linkki muotoilemattomaan versioon, jos osastoja ei voi vanhalla selaimella laajentaa näkyviin.
- Esimerkiksi Windows 98:lla Netscape 7.2 vaikutti toimivan myös muotoilun kera, versiolla 6 näkyi vain pääosastot. Versio 4:ssä tekstejä ei erota aina taustaväristä.
- Apajalistan tiedostot ovat nyt myös peilattuna täällä. Kiitos peilaajalle!
- Täältä löytyy lista kadonneista suomipeleistä.
- Kaikki suomipelit on pyritty kirjaamaan myös SuomiGameHUB:n pelitietokantaan.
- Sivuston lähdekoodi
Tilastoja:
- Tietokannassa on 67185 riviä. Näistä jatkokäsittelyä odottaa 2474 riviä.
- Varsinaisia Apaja-rivejä on 64711, joskin Jatkokäsittelyä odottavat ovat myös pääosin alkuperäisiä Apaja-tiedostoja.
- Yksittäisiä tiedostonimiä on 63817 kpl (distinct).
- 5938 riviä on merkattu tupliksi ja 654 eritupliksi.
- Uniikkeja tiedostonimiä on 64177 ottaen huomioon erituplat.
- 34773 tiedostoa on merkattu olemassaoleviksi. Näistä 32871 tiedostonimeä on yksittäisiä (distinct).
- Uniikit olemassa olevat tiedostot, mukaan lukien erituplat: 33000
- Todellinen prosenttiosuus löydetyistä, tiedossa olevista Apaja-tiedostoista, on siis 51.42 %.
- Kaikista riveistä olemassaoleviksi merkattuja on 51.76 %.
- Jos ei huomioida Jatkokäsittelyä odottavia, löydettyjä tiedostoja on 49.47 %.
- Palvelimen latauskansiossa tiedostoja (osa tuplista on myös tiedostoina kahteen kertaan): 34660
Kommenttien selityksiä:
Koko (työn alla)
- Koska tiedostoja etsitään myös muiden purkkien arkistokokoelmista, saattaa tiedoston koko heittää Apajassa listatusta. Syynä tähän voi olla esimerkiksi zip-tiedoston kommentti, tai erot paketin kuvauksessa. Kommenteissa on pyritty merkitsemään nämä erot.
- koko¹ - Sama tieodstonimi, sama koko kuin Apajalistassa (jos ilmoitettu tavuina). Mikäli koko on ilmoitettu kilotavuina, voi heittoa olla silti pyöristämisen takia.
- koko² - "fivebyte", sama tiedostonimi, koko viisi tavua pienempi kuin Apajalistassa, ei zip-kommenttia.
- koko³ - "raw_exact", sama tiedostonimi, zip-kommentin koko huomioiden sama koko kuin Apajalistassa.
- koko⁴ - "raw_fivebyte", sama tiedostonimi, zip-kommentin koko huomioiden koko viisi tavua pienempi kuin Apajalistassa.
- väärä koko - Koko heittää jostain syystä reilusti, mutta kuvaus vastaa alkuperäistä.
Repacked
- Repacked tarkoittaa, että tiedosto on pakattu uudestaan. Esimerkiksi jos sama paketti löytyi jostain eri formaatissa ja on nyt tuplapakattu.
- Repacked voi joskus myös sisältää tyystin eri version, esimerkiksi sittemmin ilmaisjakeluksi muuttuneen täysversion sharewaren sijaan.
- Jos Repacked-paketti on pakattu kahteen kertaan, väliin on voitu laittaa "lueminut.txt" selittämään, mistä on kyse.
Alkuperä:
- Jos alkuperän kohdalla lukee vain paketin nimi, esimerkiksi "mbnet_oudot.zip", on paketti ladattu todennäköisesti archive.orgista tai discmaster.textfiles.comista.
- numerosarja/levy.iso viittaa Discmaster-urliin. Esimerkiksi "3282/Aminet 14 - Oct 1996.iso" levykuvaa voi tutkia osoitteesta https://discmaster.textfiles.com/browse/3282/Aminet 14 - Oct 1996.iso.
- Tietokonemusiikki-osastolla on alkuperänä mainittu usein "archive.org" ja kommenteissa esim. "modit/arkisto.zip". Tässä on kyseessä archive.orgista löytyvä modit.zip paketti, joka sisältää mm. mainitun arkisto.zip:n.
- MBCD tarkoittaa Mikrobitin 1994-1999 vuosikertalevyjen mukana tulleita tiedostoja. Nämä ovat myös ladattu archive.orgista.
- # tunnisteella on merkattu käyttäjien omista arkistoista löytyneet tiedostot.
Tupla:
- "tupla" tarkoittaa, että sama tiedosto on kahteen kertaan sivustolla, mahdollisesti eri osastoilla ja hieman eri kuvauksella, tai päivämäärällä.
- "eritupla" tarkoittaa, että samanniminen tiedosto löytyy sivustolta, mutta kyseessä on täysin eri ohjelma, tai eri versionumero samasta ohjelmasta.
- "eritupla¹" tarkoittaa, että sivustolla on samanniminen tiedosto, jossa on koossa ja kuvauksessa eroa, mutta kyseessä on todennäköisesti silti sama ohjelma.