Oletko innostunut astumaan Data Science -maailmaan?
Onnittelut! Se on edelleen oikea valinta, koska Data Science- ja tekoälyn alalla tehtyjen töiden tarve kasvaa lopullisesti tämän pandemian aikana.

Vaikka kriisin vuoksi markkinat ovat tällä hetkellä kovemmat, jotta ne voidaan perustaa uudelleen useammalla miesvoimalla, kuten ne tekevät aiemmin. Joten, Saattaa olla mahdollista, että sinun on valmistauduttava henkisesti pitkäaikaiseen palkkaamiseen ja moniin hylkäyksiin tavallaan.

Tässä, kirjoittaessani tätä artikkelia, oletan, että olet jo tiennyt, että data-tieteen salkku on ratkaisevan tärkeää ja miten se rakennetaan.
Vietät ehkä suurimman osan ajastasi tekemällä datan murskaamista ja vääntämistä etkä soveltamalla hienoja malleja.

Yksi kysymys, jota datatieteen harrastajat ovat kyselleet minulta kerta toisensa jälkeen, on se, että millaisia projekteja heidän pitäisi sisällyttää portfolioonsa rakentaakseen valtavan hyvän ja ainutlaatuisen portfolion.

Alhaalla olen antanut 8 ainutlaatuista ideaa datatieteen portfolioosi, joihin on liitetty viiteartikkeleita, joista saat oivalluksia siitä, miten aloittaa jokin tietty idea.

Photo by dole777 on Unsplash

Tämä aihe on niin arkaluonteinen, että sitä pitää nykyään pohtia ja sille on kiireesti tehtävä jotain. Maailmassa on yli 264 miljoonaa ihmistä, jotka kärsivät masennuksesta. Masennus on maailmanlaajuisesti tärkein työkyvyttömyyden syy, ja se on merkittävä tukija maailmanlaajuisessa tautitaakassa, ja lähes 800 000 ihmistä kuolee johdonmukaisesti itsemurhan vuoksi joka vuosi. Itsemurha on toiseksi tärkein kuolinsyy 15-29-vuotiaiden keskuudessa. Masennuksen hoito viivästyy usein, on epätarkkaa ja/tai jää kokonaan saamatta.

Internet-pohjainen elämä antaa tärkeimmän mahdollisuuden muuttaa varhaista melankolian välityspalvelua, erityisesti nuorilla aikuisilla. Jatkuvasti Twitterissä lähetetään noin 6000 twiittiä, mikä tarkoittaa yli 350 000 twiittiä joka hetki, 500 miljoonaa twiittiä joka päivä ja noin 200 miljardia twiittiä joka vuosi.

Pew Research Centerin mukaan 72 % väestöstä käyttää jonkinlaista internet-pohjaista elämää. Sosiaalisista verkostoista vapautuvat tietokokonaisuudet ovat tärkeitä lukuisille aloille, esimerkiksi ihmistieteille ja aivotutkimukselle. Erikoisalan näkökulmasta tuet ovat kuitenkin kaukana riittämättömistä, ja eksplisiittiset menetelmät ovat epätoivoisesti onnensa nojassa.

Analysoimalla sosiaalisen median viesteissä esiintyviä kielellisiä merkkejä on mahdollista luoda syväoppimismalli, joka voi antaa yksilölle käsityksen hänen mielenterveydestään paljon perinteisiä lähestymistapoja aikaisemmin.

Sports match video to text summarization using neural network

Photo by Aksh yadav on Unsplash

Tämä projekti-idea perustuu siis pohjimmiltaan täsmällisen yhteenvedon saamiseen urheiluotteluvideoista. On olemassa urheilusivustoja, jotka kertovat ottelun kohokohdista. Erilaisia malleja on ehdotettu tekstin tiivistämisen tehtävään, mutta neuroverkot tekevät parhaan työn. Tiivistäminen viittaa pääsääntöisesti tiedon esittelyyn lyhyessä rakenteessa, keskittyen tosiasioita ja tietoa välittäviin osiin ja säilyttäen samalla tärkeyden.

Automaattinen tiivistelmän luominen otteluvideosta synnyttää haasteen erottaa ottelun kiehtovat minuutit eli kohokohdat.

Se voidaan siis saavuttaa käyttämällä joitakin syväoppimistekniikoita, kuten 3D-CNN (kolmiulotteiset konvoluutioverkot), RNN (toistuva neuroverkko), LSTM (pitkät lyhytaikaiset muistiverkot) ja myös koneoppimisalgoritmeja jakamalla video eri osiin ja soveltamalla sitten SVM (tukivektorikoneet), NN (neuroverkot), k-means-algoritmi.

Paremman ymmärryksen saamiseksi tutustu oheisiin artikkeleihin yksityiskohtaisesti.

Käsinkirjoitetun yhtälön ratkaisija CNN:n avulla

Kuva Antoine Dautry on Unsplash

Käsinkirjoitetun matemaattisen ilmaisun tunnistaminen on yksi hämmentävistä kysymyksistä tietokonenäön tutkimuksen alueella. Voit kouluttaa käsinkirjoitettujen numeroiden ja matemaattisten symbolien avulla käsinkirjoitetun yhtälönratkaisijan käyttämällä konvolutiivista neuroverkkoa (Convolutional Neural Network, CNN) ja joitakin kuvankäsittelytekniikoita. Tällaisen järjestelmän kehittäminen edellyttää koneidemme kouluttamista datan avulla, jotta ne oppisivat ja tekisivät tarvittavan ennusteen.

Katsokaa alla olevia artikkeleita paremman ymmärryksen saamiseksi.

Business meeting summary generation using NLP

Photo by Sebastian Herrmann on Unsplash

Oletko koskaan joutunut tilanteeseen, jossa kaikki haluavat nähdä yhteenvedon, eivät kokonaisia raportteja. No, olen itse kohdannut sen koulu- ja opiskeluaikana, jolloin käytimme paljon aikaa kokonaisen raportin laatimiseen, mutta opettajalla on aikaa lukea vain yhteenveto.

Yhteenveto on noussut vääjäämättömän hyödylliseksi tavaksi ratkaista tiedon ylikuormitusta koskeva ongelma. Tietojen poimimisella keskusteluista voi olla erittäin hyvä kaupallinen ja opetuksellinen arvo. Tämä voidaan tehdä ottamalla ominaisuuksina talteen tilastolliset, kielelliset ja sentimentaaliset näkökohdat keskustelun dialogirakenteella.

Kertomuksen muuttaminen manuaalisesti tiivistettyyn muotoon on liian aikaa vievää, eikö olekin? Mutta siinä voi luottaa luonnollisen kielen prosessointitekniikoihin (Natural Language Processing, NLP).

Tekstin tiivistäminen syväoppimisen avulla voi ymmärtää koko tekstin kontekstin. Eikö se olekin unelmien täyttymys meille kaikille, jotka tarvitsemme nopeaa tiivistelmää asiakirjasta !!!

Katsokaa alla olevia artikkeleita paremman ymmärryksen saamiseksi.

Kasvojentunnistus tunnistaa mielialan ja ehdottaa kappaleita sen mukaan

Kuva: Alireza Attari on Unsplash

Ihmisen kasvot ovat tärkeä osa yksilön vartaloa, ja niillä on erityisen suuri merkitys, kun halutaan tuntea yksilön mielentila. Tämä poistaa ikävän ja tylsän tehtävän, joka liittyy kappaleiden manuaaliseen eristämiseen tai ryhmittelyyn eri levyihin, ja auttaa luomaan sopivan soittolistan yksilön tunnepiirteiden perusteella.

Ihmisillä on tapana kuunnella musiikkia mielialansa ja kiinnostuksen kohteidensa mukaan. Voidaan luoda sovellus, joka ehdottaa käyttäjille heidän mielialaansa perustuvia kappaleita tallentamalla kasvojen ilmeitä.

Tietokonenäkö on monitieteinen ala, joka auttaa välittämään korkeatasoisen ymmärryksen digitaalisista kuvista tai videoista tietokoneille.Tietokonenäön komponentteja voidaan käyttää käyttäjän tunteiden määrittämiseen kasvojen ilmeiden perusteella.

On myös näitä API:ita, joita pidin mielenkiintoisina ja hyödyllisinä, vaikka en työskennellyt niiden parissa, mutta liitän ne tähän toivoen, että ne auttavat sinua.

Esintokelpoisten eksoplaneettojen löytäminen Keplerin kaltaisten avaruusalusten ottamista kuvista

Kuvan on ottanut Nick Owuor (astro.nic.visuals) on Unsplash

Viime vuosikymmenellä seurattiin yli miljoonaa tähteä kiertävien planeettojen tunnistamiseksi. Mahdollisten eksoplaneettaehdokkaiden manuaalinen tulkinta on työlästä ja altis inhimillisille virheille, joiden seurauksia on vaikea arvioida. Konvolutiiviset neuroverkot soveltuvat Maan kaltaisten eksoplaneettojen tunnistamiseen kohinaisesta aikasarjadatasta merkittävämmällä tarkkuudella kuin pienimmän neliösumman strategia.

Kuvan regenerointi vanhalle vaurioituneelle kelakuvalle

Lähde Pikist

Tiedän, kuinka aikaa vievää ja tuskallista on saada vanha vaurioitunut valokuva takaisin alkuperäiseen muotoonsa sellaisena kuin se oli aiemmin. Tämä voidaan siis tehdä syväoppimisen avulla löytämällä kaikki kuvan viat (murtumat, naarmut, reiät) ja käyttämällä Inpainting-algoritmeja voidaan helposti löytää viat niiden ympärillä olevien pikseliarvojen perusteella vanhojen valokuvien palauttamiseksi ja värittämiseksi.

Musiikin tuottaminen syväoppimisen avulla

Kuva: Abigail Keenan on Unsplash

Musiikki on valikoima eri taajuuksilta peräisin olevia ääniä. Automaattinen musiikkigeneraatio on siis prosessi, jossa sävelletään lyhyt musiikkikappale mahdollisimman vähällä ihmisen välityksellä . Viime aikoina Deep Learning -tekniikasta on tullut ohjelmoidun musiikkigeneraation kärki.

LOPPUSANAT

Tiedän, että on todellinen kamppailu rakentaa siisti datatieteen portfolio. Mutta tällaisella kokoelmalla, jonka olen edellä tarjonnut, voit edetä keskimääräistä paremmin kyseisellä alalla. Kokoelma on uusi, mikä antaa mahdollisuuden myös tutkimustarkoituksiin. Joten Data-Science-tutkijat voivat myös valita nämä ideat työstettäväksi, jotta heidän tutkimuksensa olisi suuri apu Data Scientistsille projektin aloittamiseksi. Ja lisäksi Se on todella hauskaa tutkia puolia, joita kukaan ei ole tehnyt aiemmin.
Vaikka, tämä kokoelma on itse asiassa muodostuu ideoita alusta edistyneeseen tasoon.

Siten, en suosittele tätä vain aloittelijoille datatieteen alalla, vaan myös vanhemmille datatieteilijöille. Se avaa monia uusia polkuja urasi aikana, ei vain projektien takia vaan myös vastikään hankitun verkoston kautta.

Nämä ideat näyttävät sinulle laajan valikoiman mahdollisuuksia ja antavat sinulle ideoita ajatella laatikon ulkopuolelta.

Mulle ja ystävilleni oppimistekijät, lisäarvon tuottaminen yhteiskunnalle ja tutkimaton tieto ovat tärkeitä ja hauskuus on tavallaan olennaista. Joten pohjimmiltaan nautin sellaisten hankkeiden tekemisestä, jotka antavat meille mahdollisuuden hankkia valtavasti tietoa tavallaan ja antaa meidän tutkia tutkimattomia ulottuvuuksia. Siihen keskitymme, kun käytämme aikaa tällaisiin hankkeisiin.

admin

Vastaa

Sähköpostiosoitettasi ei julkaista.

lg