Bezár
Hírek

Honnan lehet tudni, hogy valaki férfi vagy nő? A Data Science kisegít

A való életben még manapság is viszonylagos biztonsággal megtudjuk állapítani, hogy valaki férfi vagy nő, akár vizuális felméréssel, akár név alapján. Ez utóbbi esetben az illető keresztnevét összevetjük a fejünkben lévő férfi és női keresztnevek listájával, és az alapján döntjük el. De mi a helyzet akkor, ha több ezer névből álló névlistából szeretnénk megállapítani, hogy ki a férfi és nő?

Data Science tanfolyamon írt gyakorló program


Petrík Éva, a DataScience képzésünk egyik ügyes tanulója remekül oldotta meg ezt a nem is olyan egyszerű feladatot. Éva és csoporttársai egy többezer névből álló listát kaptak bemenetként.

 

Első lépésként a program szétválogatja a teljes neveket külön vezeték és keresztnévre, pontosabban keresztnevekre, mert vannak, akiknek ravaszul 3 nevük van, és akkor még nem is beszéltünk a Becze-Zsoltné Kocsis Krisztina Melánia jellegű speciális esetekről. Sőt, reguláris kifejezések használatával meg kellet "szabadulnunk" a Dr.- októl is.
Érdekesség: ebben az emberek elég jók. Ha kézfogás közben valaki a szemünkbe néz és azt mondja, hogy "Dr. Kocsis Krisztián", különösebb gondolkodás nélkül tudjuk, hogy nem Kocsis és nem is Doktor a keresztneve! A programunknak viszont ehhez függvények kellenek.

 

python kód

 

Éva azokra is gondolt, akik ékezet nélkül adták meg nevüket, szerencsére erre is van egy jó függvény. Ezután leszedte a magyar férfi és női keresztnevek listáját a netről, abból alkotva adatbázist, és így a program már betudja azonosítani, ki hova tartozik, kicsit hasonlóan ahhoz, ahogy egy ember is gondolkozik. Minden egyes névnél megnézi, hogy az a név a férfi vagy női nevek adatbázisában szerepel-e, és annak megfelelően kap az adott név egy új adatot: férfi avagy nő.   

 

Mi történik, ha egy névben nincs felismerhető keresztnév egyik listában sem? Ez akkor fordulhat elő, ha valakinek külföldi neve van, vagy esetleg a becenevével szerepel az adatbázisban (tudtátok, hogy nincs olyan név, hogy Zsófi?)

 

python kód

 

A megoldás az lett, hogy ilyenkor a felhasználótól kér segítséget a program. Néha jól jön, ha ott ül egy jó öreg ember! Viszont a választ követően az új névvel bővül a férfi vagy a női nevek listája is, így legközelebb már tudni fogja a program ezt is.

 

Ki is próbáltuk a programot a Prooktatás diákjainka adatbázisával, és minden szuperül működött. Így most már azt is tudjuk, amit eddig nem:

 

a Prooktatás tanulóinak éppen egynegyede nő, és 75%-a férfi.

 

Ha te is kipróbálnád a programot, akkor innen letöltheted. Tedd be ugyanabba a könyvtárba a neveidet tartalmazó táblázatot, ez fontos, ahol a .exe file van, indítsd el a programot, és ott válaszd a 2.opciót. A végén a program létrehoz neked egy új excel filet, ami már a nevek mellett nemeket is tartalmazza.

 

Tanfolyam logó

Ide kapcsolódik:
Data Science tanfolyam

 

 

HTML / CSS
19 Május
26 Június
NYÁR
Python
23 Június
28 Június
NYÁR
PHP
6 Május
18 Június
NYÁR
Full-stack
24 Április
19 Május
26 Június
C#
17 Május
1 Szept.
  Mit tanuljak?  

Tanfolyam-naptár