Sivu 1/1

Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 03 Syys 2019 05:20
Kirjoittaja Lri
Tein kuvia Museoviraston julkaisemista vanhoista valokuvista, joista OpenCV-konenäkökirjasto onnistui paikantamaan kasvojen koordinaatit.

Kuvat ovat enimmäkseen "Kansatieteen kuvakokoelma"-nimisestä kokoelmasta (https://www.kuvakokoelmat.fi/pictures/search?hakuehto_1=kokoelma&hakusana_1=Kansatieteen+kuvakokoelma).

Suurin osa kuvista on suomalaisista, mutta jotkin kuvat ovat karjalaisista. Joidenkin karjalaisten kansasta olevien kuvien yhteydessä ei ole mainittu, ovatko kuvat suomalaisista vai karjalaisista, joten en viitsinyt ruveta yksitellen tarkastamaan, että mitkä kuvat ovat karjalaisista. Joukossa voi vahingossa olla myös muutamia saamelaisia, vaikka ohitin esimerkiksi monia Samuli Paulaharjun ottamia kuvia Pohjois-Suomesta, koska en ollut varma, olivatko kuvat saamelaisista.

Käytin tällaista skriptiä naamojen koordinaattien etsimiseen:

Koodi: Valitse kaikki
import cv2
import sys

face_cascade=cv2.CascadeClassifier('/usr/local/opt/opencv/share/opencv4/haarcascades/haarcascade_frontalface_default.xml')
for a in sys.argv[1:]:
    img=cv2.imread(a)
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    faces=face_cascade.detectMultiScale(gray,1.3,5)
    for(x,y,w,h)in faces:
        print(a,x,y,w,h)


Sitten kroppasin kuvat ajamalla tämänlaisen shellikomennon:

Koodi: Valitse kaikki
<facecoordinates awk '{printf"%04d ",NR;print$1,1.4*$4"x"1.8*$5"+"$2-.2*$4"+"$3-.4*$5}'|parallel -C\  convert {2} -crop {3} +repage cropped/{1}.png


En valikoinut OpenCV:n löytämiä naamoja muuten kuin niin, että poistin kuvat joissa ei oikeasti ollut naamaa, ja että poistin joitain todella huonolaatuisia kuvia.

Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva

Jos joku muu aikoo ruveta lataamaan kuvia Museoviraston nettisivuilta, esimerkiksi näin saa haettua pikkukuvien URL:t Samuli Paulaharjun kuvista:

Koodi: Valitse kaikki
for p in {1..211};do curl -s "https://www.kuvakokoelmat.fi/pictures/search?hakuehto_1=tekija&hakusana_1=%22Paulaharju+Samuli%22&page=$p"|pup '.preview attr{name}';done

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 04 Syys 2019 10:00
Kirjoittaja Lri
Tässä viestissä on kuvia saamelaisista, karjalaisista, hanteista, mordvalaisista ja virolaisista.

Saamelaiset

Hain ensin kaikki kuvat hakusanalla "saamelaiset":

Koodi: Valitse kaikki
for p in {1..38};do curl -s "https://www.kuvakokoelmat.fi/pictures/search?hakuehto_1=asiasana&hakusana_1=saamelaiset&page=$p"|pup '.preview attr{name}';done


Valikoin sitten haun palauttaman 374 kuvan joukosta 234 sellaista kuvaa, jossa näkyi ainakin yhden henkilön naama.

Latasin sitten isommat versiot valikoimistani kuvista tämänlaisella skriptillä:

Koodi: Valitse kaikki
rm -rf /tmp/tiles;mkdir -p /tmp/tiles ~/isot

for x in SUK2/SUK262_8 HK19/HK19731119_4575;do
  (cd /tmp/tiles;parallel -j10 curl -sO ::: https://www.kuvakokoelmat.fi/pictures/zoom/${x}_zdata/TileGroup0/4-{0..15}-{0..15}.jpg)
  find /tmp/tiles -type f -empty -delete
  montage $(printf %s\\n /tmp/tiles/*|sort -t- -nk3 -nk2) -geometry +0+0 -tile x$(ls /tmp/tiles|cut -d- -f3|sort -u|wc -l) -quality 90 ~/isot/${l#*/}.jpg
  rm /tmp/tiles/*
done


Kroppasin sen jälkeen naamat kuvista OpenCV:n ja ImageMagickin avulla. OpenCV ei löytänyt ehkä neljännestä kuvissa olevista naamoista. En karsinut OpenCV:n löytämiä kuvia muuten kuin niin, että poistin kuvat joissa ei oikeasti ollut naamaa, että poistin kuvat joissa oli naama mutta jotka oli kropattu väärin, että poistin kuvat henkilöistä joiden en arvellut olevan saamelaisia, ja että poistin joitain todella huonolaatuisia kuvia.

Kuvien alapuolella on tunnus, jonka alkuun lisäämällä "http://kuvakokoelmat.fi/pictures/view/" saa avattua kuvan sivun.

Kuva

Karjalaiset

Näiden kuvien metadatassa kansaksi oli asetettu "karjalaiset" (https://www.kuvakokoelmat.fi/pictures/search?hakuehto_1=kansaheimo&hakusana_1=%22karjalaiset%22).

Kuvien metadatan mukaan kuvat otti:

- Suojärvelta Gösta Grotenfelt vuonna 1913 (KK1178),
- Vienan Karjalasta A. O. Väisänen vuonna 1915 (SUK129),
- Suojärveltä Auvo Hirsjärvi vuonna 1935 (KK1899),
- Itä-Karjalasta Väinö Kaukonen vuonna 1943 (SUK475).

Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva

Hantit

Kaikki nämä kuvat otti U.T. Sirelius vuosina 1898-1900 (https://www.kuvakokoelmat.fi/pictures/quicksearch?hakusana=hantit). En tiedä, ovatko jotkut kuvien henkilöistä vaikka nenetsejä tai selkuppeja. Näistäkin kuvista puutuu monta naamaa, koska OpenCV ei taaskaan löytänyt läheskään kaikkien alkuperäisissä kuvissa olevien naamojen koordinaatteja.

Kuva
Kuva
Kuva
Kuva

Mordvalaiset

Kaikki nämä kuvat otti A. O. Väisänen vuonna 1914 (https://www.kuvakokoelmat.fi/pictures/quicksearch?hakusana=mordvalaiset). Kuvien metadatasta ei selviä, ovatko kuvat ersistä vai moksista.

Kuva

Virolaiset

Kaikki nämä kuvat otti A.O. Väisänen vuosina 1912-1914 (https://www.kuvakokoelmat.fi/pictures/quicksearch?hakusana=virolaiset). Jotkut kuvat ovat setukaisista.

Kuva

Keskivertomorfeja

Tässä on vielä morfeja noin 15-45-vuotiaista henkilöistä, jotka katsoivat suunnilleen kameraan päin, ja joiden kuvat olivat suhteellisen hyvälaatuisia.

Kuva

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 04 Syys 2019 10:34
Kirjoittaja Kinaporin kalifi
Hienoa työtä, Lri!

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 04 Syys 2019 18:08
Kirjoittaja Lri
Tässä on vielä samanlaisia kuvia Kunstkameran kokoelmista (http://collection.kunstkamera.ru). En käynyt läpi kaikkia kuvia, vaan ainoastaan kuvia joita olin muutama vuotta sitten tallentanut koneelleni. Niistäkään OpenCV ei taas löytänyt läheskään kaikkia naamoja.

Kuvan alapuolella olevan numeron alkuun lisäämällä "http://collection.kunstkamera.ru/entity/OBJECT/" saa avattua kuvan sivun.

Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva

Valitsin ylläolevien kuvien joukosta morfausta varten kuvia noin 15-45-vuotiaista henkilöistä, jotka katsoivat suunnilleen kameraan päin, ja joiden kuvat eivät olleet kauhean huonolaatuisia. Sellaisia kuvia oli yhteensä 185, mutta niistäkään morfien generoimiseen käyttämäni Python-pakkaus ei hyväksynyt kuin 63, joten yksittäisten kansojen morfit eivät oikein onnistuneet. Kokeilin sen takia tehdä morfit kaikkien eri kansojen kuvista. Miesten kuvassa on 7 hantia, 5 nenetsiä, 3 komia, 2 mokshaa, 2 karjalaista ja 1 udmurtti. Naisten kuvassa on 13 hantia, 7 mokshaa, 7 komia, 5 maria, 3 nenetsiä, 3 udmurttia, 2 suomalaista, 2 karjalaista ja 1 vepsäläinen.

Kuva

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 06 Syys 2019 12:03
Kirjoittaja tenku
Kuva

Suosittelen lueskelemaan tuon kirja-sarjan. Sieltä löytyy kymmeniä tuhansia suhteellisen hyvälaatuisia kuvia karjalaisista.

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 06 Syys 2019 12:20
Kirjoittaja Jaska
Lri kirjoitti:Valitsin ylläolevien kuvien joukosta morfausta varten kuvia noin 15-45-vuotiaista henkilöistä, jotka katsoivat suunnilleen kameraan päin, ja joiden kuvat eivät olleet kauhean huonolaatuisia. Sellaisia kuvia oli yhteensä 185, mutta niistäkään morfien generoimiseen käyttämäni Python-pakkaus ei hyväksynyt kuin 63, joten yksittäisten kansojen morfit eivät oikein onnistuneet. Kokeilin sen takia tehdä morfit kaikkien eri kansojen kuvista. Miesten kuvassa on 7 hantia, 5 nenetsiä, 3 komia, 2 mokshaa, 2 karjalaista ja 1 udmurtti. Naisten kuvassa on 13 hantia, 7 mokshaa, 7 komia, 5 maria, 3 nenetsiä, 3 udmurttia, 2 suomalaista, 2 karjalaista ja 1 vepsäläinen.

Kuva

Hauska idea. Siinä ovat meidän kantauralilaisemme. PDT_Armataz_01_18

Sopisivat muuten ihan nätisti Volgan mutkaan, eli marien ja udmurttien keskuuteen.

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 06 Syys 2019 16:02
Kirjoittaja Lri
Jaska kirjoitti:Hauska idea. Siinä ovat meidän kantauralilaisemme. PDT_Armataz_01_18

Sopisivat muuten ihan nätisti Volgan mutkaan, eli marien ja udmurttien keskuuteen.


No joo, kokeilin myös tehdä Museoviraston kuvista morfeja, joissa on yhtä monta hantia ja suomalaista, mutta niistä tuli vähän erinäköisiä. Ne näyttää enemmän siperialaiselta kuin saamelaiset, vaikka saamelaiset malliintui Tambets et al. 2018:ssa suunnilleen puoliksi suomalaisina ja puoliksi hanteina.

Kuva

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 06 Syys 2019 19:33
Kirjoittaja Lri
Tässä on vielä kuvia tuossa blogissa julkaistuista mustavalkoisista kuvista: http://kuvahiset.blogspot.com/.

En karsinut kuvia muuten kuin niin, että ohitin joitain huonolaatuisimpia kuvia, ja että ohitin kuvat, jotka sisältyivät muistaakseni jo aikaisemmin tähän threadiin postaamiini kuviin. Käyttämäni konenäkökirjasto (OpenCV) ei taaskaan kyllä löytänyt läheskään kaikkia kuvissa olevista naamoista. Jotkut kuvat on ehkä luokiteltu väärän kansan alle.

Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva
Kuva

Valikoin taas morfattavaksi kelpaavia kuvia noin 15-45-vuotiaista, mutta niitä ei ollut tarpeeksi paljon muuta kuin naispuolisista saamelaisista, joiden morfista tuli tämännäköinen:

Kuva

tenku kirjoitti:Kuva

Suosittelen lueskelemaan tuon kirja-sarjan. Sieltä löytyy kymmeniä tuhansia suhteellisen hyvälaatuisia kuvia karjalaisista.


Täh, kymmeniä tuhansia? Sitä ei löytynyt ainakaan meidän paikkakunnan kirjastosta, vaikka siellä oli muistaakseni joku samantyyppinen kirja tai kirjasarja.

Re: Suomalaisten naamoja Museoviraston vanhoista kuvista

ViestiLähetetty: 06 Syys 2019 20:28
Kirjoittaja tenku
Täh, kymmeniä tuhansia? Sitä ei löytynyt ainakaan meidän paikkakunnan kirjastosta, vaikka siellä oli muistaakseni joku samantyyppinen kirja tai kirjasarja.



https://www.huuto.net/kohteet/siirtokar ... /501959678

Kirjaan on siis luetteloitu jokikinen Karjalan evakko - mistä muutti ja minne. Lisäksi jotain nippelitietoa että mitä duunailee sun muut. Jokaiselle sivulle on lisäksi ripoteltu kuvia näistä pölleist. Muistaakseni jotain 5-10 kuvaa per sivu. Saatto olla kyllä enemmänkin. Yleensä kasvokuva suoraan edestä. Yhdessä osassa on 1500 sivua, ja neljä osaa siis. Kun noit laskee yhteen, niin kait kuva-kokonaisluku kymmeniin tuhansiin menee.