Kajal Yadav, szabadúszó író az adattudományról, startupokról & vállalkozói tevékenységről.

Forrás Unsplash, szerkesztette a szerző.

Az adattudomány világába szeretne belépni? Gratulálok! Ez még mindig a helyes választás, mert a világjárvány idején az Adattudomány és a mesterséges intelligencia területén végzett munka iránti igény végső fellendülése miatt.

A válság miatt azonban a piac jelenleg keményebbé válik, hogy újra több férfi erővel állíthassa fel, mint korábban. Tehát, Lehetséges, hogy mentálisan fel kell készülnie a hosszú távú felvételi útra és sok elutasításra az út mentén.

Ezzel, miközben ezt a cikket írom, feltételezem, hogy már tudja, hogy az adattudományi portfólió kulcsfontosságú, és hogyan kell felépíteni.
Az időd nagy részét lehet, hogy adatfeldolgozással és adatfeldolgozással töltöd, nem pedig fantáziadús modellek alkalmazásával.

Az egyik kérdés, amit az adattudomány szerelmesei újra és újra feltesznek nekem, az, hogy milyen projekteket kell felvenniük a portfóliójukba, hogy egy rettentően jó és egyedi portfóliót építsenek.

Az alábbiakban 8 egyedi ötletet adok az adattudományi portfóliójához a csatolt referenciacikkekkel, amelyekből betekintést nyerhet, hogy hogyan kezdjen hozzá az adott ötlethez.

Sentimentelemzés a depresszióhoz a közösségi média bejegyzések alapján

Photo by dole777 on Unsplash.

Ezt a témát manapság annyira érzékenynek kell tekinteni, és sürgősen tennünk kell valamit. Világszerte több mint 264 millió ember szenved depresszióban. A depresszió világszerte a rokkantság fő oka, és jelentős támogatója az általános globális betegségtehernek, és évente közel 800 000 ember harap következetesen öngyilkosság miatt a sírba. A 15-29 évesek körében az öngyilkosság a második vezető halálozási ok. A depresszió kezelése gyakran késik, pontatlan, vagy teljesen elmarad.

Az internetalapú élet a legfőbb esélyt adja a korai melankólia-közvetítő szolgáltatások megváltoztatására, különösen a fiatal felnőtteknél. A Twitteren állandóan nagyjából 6000 tweetet tweetelnek, ami minden pillanatban több mint 350 000 elküldött tweetet, minden nap 500 millió tweetet és minden évben mintegy 200 milliárd tweetet jelent.

A Pew Research Center adatai szerint a lakosság 72%-a használ valamilyen internetalapú életet. A közösségi hálózatokból felszabaduló adatkészletek számos terület, például a humán tudományok és az agykutatás számára fontosak. Szakmai szempontból azonban a támpontok messze nem elegendőek, és az explicit módszertanok kétségbeejtően szerencsétlenek.

A közösségi média posztjaiban található nyelvi markerek elemzésével olyan mély tanulási modell hozható létre, amely a hagyományos megközelítéseknél jóval korábban adhat betekintést az egyén mentális egészségébe.

  • You Are What You Tweet – Detecting Depression in Social Media via Twitter Usage
  • Early Detection of Depression: Social Network Analysis and Random Forest Techniques – Original paper, University of A Coruna.
  • Depression detection from social network data using machine learning techniques

Sports match video to text summarization using neural network

Photo by Aksh yadav on Unsplash.

So this project idea is basically based on getting a precise summary out of sports match videos. Vannak olyan sportoldalak, amelyek a mérkőzés csúcspontjairól számolnak be. A kivonatos szöveges összegzés feladatára különböző modelleket javasoltak, de a neurális hálózatok végzik a legjobb munkát. Az összegzés általában az információk rövid szerkezetben történő bemutatására utal, a tényeket és információkat közvetítő részekre koncentrálva, a fontosság megőrzése mellett.

A meccsvideó vázlatának automatikus elkészítése kihívást jelent a mérkőzés izgalmas perceinek vagy csúcspontjainak megkülönböztetése.

Ezt tehát néhány mély tanulási technikával, például 3D-CNN (háromdimenziós konvolúciós hálózatok), RNN (rekurrens neurális hálózat), LSTM (hosszú rövidtávú memória hálózatok), valamint gépi tanulási algoritmusok segítségével lehet elérni, a videót különböző szakaszokra osztva, majd SVM (Support vector machines), NN (Neural Networks) és k-means algoritmusok alkalmazásával.

A jobb megértés érdekében olvassa el részletesen a mellékelt cikket.

  • Scene Classification for Sports Video Summarization Using Transfer Learning – Ez a cikk egy új módszert javasol a sportvideók jelenetosztályozására.

Kézzel írt egyenletmegoldó CNN használatával

Photo by Antoine Dautry on Unsplash.

A kézzel írt matematikai kifejezések felismerése az egyik zavaró kérdés a számítógépes látáskutatás területén. Kézzel írott számjegyek és matematikai szimbólumok segítségével kézzel írott egyenletmegoldót képezhetünk ki konvolúciós neurális hálózat (CNN) segítségével, néhány képfeldolgozási technikával. Egy ilyen rendszer kifejlesztéséhez a gépeinket adatokkal kell betanítani, hogy azok jártasak legyenek a tanulásban és a szükséges előrejelzésben.

A jobb megértéshez olvassa el az alább csatolt cikkeket.

  • Kézzel írott egyenletmegoldó konvolúciós neurális hálózat használatával
  • vipul79321/Handwritten-Equation-Solver – An Handwritten Equation solver using CNN Equation can contain any digit from 0-9 and symbol.
  • Computer Vision – Kézzel írt matematikai válaszlapok automatikus osztályozása – Egy papírra szabadkézzel írt matematikai egyenlet megoldásának lépéseinek digitalizálása.
  • Kézzel írt egyenletek LaTeX-be

Üzleti megbeszélések összefoglalójának generálása NLP segítségével

Photo by Sebastian Herrmann on Unsplash.

Elakadt már olyan helyzetben, amikor mindenki egy összefoglalót akar látni, nem pedig a teljes jelentést? Nos, én is szembesültem ezzel iskolai és egyetemi éveim alatt, amikor rengeteg időt töltöttünk egy teljes jelentés elkészítésével, de a tanárnak csak az összefoglaló elolvasására volt ideje.

Az összegzés az adattúlterhelés problémájának kezelésében kérlelhetetlenül hasznos módszerként emelkedett ki. A beszélgetésekből származó információk kinyerése nagyon jó kereskedelmi és oktatási értéket képviselhet. Ez a statisztikai, nyelvi és érzelmi szempontoknak a beszélgetés dialógusszerkezetével együtt történő jellemző rögzítésével érhető el.

A jelentés összefoglaló formára történő kézi átalakítása túlságosan időigényes, nem igaz? De támaszkodhatunk a természetes nyelvfeldolgozási (NLP) technikákra, hogy ezt elérjük.

A mélytanulással történő szövegösszefoglalás képes megérteni a teljes szöveg kontextusát. Hát nem egy valóra vált álom mindannyiunk számára, akiknek gyorsan össze kell foglalniuk egy dokumentumot!

A jobb megértéshez olvassa el az alább csatolt cikkeket.

  • Comprehensive Guide to Text Summarization using Deep Learning in Python – “Nem akarok egy teljes jelentést, csak egy összefoglalót az eredményekről.”
  • Értsd meg a szövegösszegzést és készíts saját összegzőt pythonban – Az összegzés úgy definiálható, mint egy tömör és gördülékeny összefoglaló előállításának feladata, a kulcsfontosságú információk megőrzése mellett.

Az arcfelismerés a hangulat felismerésére, és ennek megfelelően dalokat javasol

Photo by Alireza Attari on Unsplash.

Az emberi arc fontos része az egyén testének, és különösen fontos szerepet játszik az ember lelkiállapotának megismerésében. Ez kiküszöböli a dalok kézzel történő elkülönítésének vagy különböző lemezekbe való csoportosításának unalmas és fárasztó feladatát, és segít az egyén érzelmi jellemzői alapján megfelelő lejátszási lista létrehozásában.

Az emberek hajlamosak a hangulatuk és érdeklődési körük alapján zenét hallgatni. Létre lehet hozni egy olyan alkalmazást, amely az arckifejezések rögzítésével dalokat javasol a felhasználóknak a hangulatuk alapján.

A számítógépes látás egy interdiszciplináris terület, amely segít a digitális képek vagy videók magas szintű megértését közvetíteni a számítógépek számára. A számítógépes látás összetevői felhasználhatók a felhasználó érzelmének meghatározására az arckifejezéseken keresztül.

Az API-k között is vannak olyanok, amelyeket érdekesnek és hasznosnak találtam. Ezeken azonban nem dolgoztam, de csatolom ide, abban a reményben, hogy ezek segítenek neked.

  • 20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | Nordic APIs – Ha a vállalkozások bármikor érzékelhetnék az érzelmeket a technológia segítségével, akkor kihasználhatnák azt, hogy eladjanak a fogyasztóknak.

Lakható exobolygók felderítése az olyan űreszközök által rögzített képekből, mint a Kepler

Photo by Nick Owuor (astro.nic.visuals) on Unsplash.

A legutóbbi évtizedben több mint egymillió csillagot figyeltek meg az átvonuló bolygók azonosítására. A potenciális exobolygójelöltek kézi értelmezése munkaigényes és ki van téve emberi hibáknak, amelyek következményeit nehéz felmérni. A konvolúciós neurális hálózatok alkalmasak Föld-szerű exobolygók azonosítására zajos idősoros adatokban, kiemelkedőbb pontossággal, mint a legkisebb négyzetek stratégiája.

  • Exobolygóvadászat gépi tanulással – Vadászat a Naprendszerünkön túli világokra.
  • Mesterséges intelligencia, NASA adatok felhasználásával exobolygókat fedeztek fel – Naprendszerünk most már holtversenyben a legtöbb bolygót tartalmazza egyetlen csillag körül.

Képregenerálás régi sérült tekercsképhez

Forrás Pikist.

Tudom, milyen időigényes és fájdalmas, hogy a régi sérült fényképet eredeti formájában kapjuk vissza, ahogy korábban volt. Ez tehát mélytanulással megoldható az összes képhiba (törések, karcolások, lyukak) megtalálásával és festésbefestő algoritmusok segítségével, így a körülöttük lévő pixelértékek alapján könnyen felfedezhetjük a hibákat, hogy helyreállítsuk és színezzük a régi fényképeket.

  • Régi képek színezése és helyreállítása mélytanulással – A fekete-fehér képek színezése mélytanulással lenyűgöző bemutatója lett a valós alkalmazásnak.
  • Guide to Image Inpainting: A gépi tanulás felhasználása a fényképek hibáinak szerkesztésére és javítására
  • How To Perform Image Restoration Absolutely DataSet Free

Music generation using deep learning

Photo by Abigail Keenan on Unsplash.

A zene különböző frekvenciájú hangok összessége. Az automatikus zenei generálás tehát egy rövid zenemű megkomponálásának folyamata, a lehető legkevesebb emberi közvetítéssel. A közelmúltban a mélytanulási technika vált a programozott zenei generálás élvonalába.

  • Zene generálása mélytanulással
  • Hogyan generáljunk zenét egy LSTM neurális hálózat segítségével Kerasban – Bevezetés a zene létrehozásába LSTM neurális hálózatok segítségével

Végszó

Tudom, hogy igazi küzdelem egy menő adattudományi portfólió felépítése. De egy ilyen gyűjteménnyel, amit fentebb adtam, átlagon felüli haladást érhetsz el ezen a területen. A gyűjtemény új, ami lehetőséget ad kutatási célokra is. Tehát az adattudományi kutatók is kiválaszthatják ezeket az ötleteket a munkájukhoz, így a kutatásuk nagy segítség lenne az adattudósok számára a projekt megkezdéséhez. Ráadásul szórakoztató felfedezni azokat az oldalakat, amelyeket korábban még senki sem tett meg. Bár ez a gyűjtemény valójában a kezdőtől a haladó szintekig terjedő ötleteket alkot.

Szóval, ezt nem csak az adattudomány területén lévő újoncoknak, hanem a vezető adattudósoknak is ajánlom. Sok új utat fog megnyitni a karrierje során, nemcsak a projektek miatt, hanem az újonnan szerzett hálózat révén is.

Ezek az ötletek megmutatják a lehetőségek széles skáláját, és ötleteket adnak a dobozon kívüli gondolkodáshoz.

Nekem és a barátaimnak a tanulási tényezők, a társadalom számára hozzáadott érték és a feltáratlan tudás fontos, és a szórakozás bizonyos értelemben elengedhetetlen. Tehát alapvetően élvezem az olyan projekteket, amelyek módot adnak arra, hogy bizonyos értelemben hatalmas tudásra tegyünk szert, és lehetővé teszik számunkra, hogy felfedezzük a fel nem fedezett dimenziókat. Ez a fő célunk, amikor időt szánunk az ilyen projektekre.

Original. Engedéllyel újraközölve.

Bio: Kajal Yadav szabadúszó író, aki az adattudományra, a startupokra és a vállalkozásra specializálódott. Számos kiadványnak ír, ugyanakkor startupokkal dolgozik a tartalommarketing stratégiáikon.

Hasonló:

  • Start Your Machine Learning Career in Quarantine
  • Projects to Include in a Data Science Portfolio
  • How to Build a Data Science Portfolio

admin

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

lg