Těšíte se na vstup do světa datové vědy?
Gratulujeme! Stále je to správná volba, protože během této pandemie došlo ke konečnému nárůstu potřeby práce v oblasti Data Science a umělé inteligence.

Ačkoli kvůli krizi se trh v současné době stává tvrdším, aby jej bylo možné znovu nastavit s větší mužskou silou, jak to dělají dříve. Takže je možné, že se budete muset psychicky připravit na dlouhou cestu přijímání zaměstnanců a mnoho odmítnutí v určitém smyslu.

Při psaní tohoto článku předpokládám, že již víte, že portfolio datových věd je klíčové a jak ho vybudovat.
Možná strávíte většinu svého času tím, že se budete zabývat chroupáním a zpracováváním dat a nebudete aplikovat fantastické modely.

Jednou z otázek, kterou mi stále dokola pokládají nadšenci do datové vědy, je, že jaký druh projektů by měli zahrnout do svého portfolia, aby si vybudovali ohromně dobré a jedinečné portfolio.

Níže uvádím 8 jedinečných nápadů pro vaše portfolio datové vědy s přiloženými referenčními články, ze kterých získáte přehled o tom, jak začít s konkrétním nápadem.

Foto: dole777 na Unsplash

Toto téma je v dnešní době tak citlivé, že je třeba s ním něco dělat. Na světě je více než 264 milionů jedinců, kteří trpí depresí. Deprese je celosvětově hlavní příčinou invalidity a významně se podílí na celkové globální zátěži nemocí a téměř 800 000 jedinců si každoročně trvale ukousne život kvůli sebevraždě. Sebevražda je druhou nejčastější příčinou úmrtí osob ve věku 15-29 let. Léčba deprese je často opožděná, nepřesná a/nebo zcela vynechaná.

Internetový život dává hlavní šanci na změnu služeb včasné mediace melancholie, zejména u mladých dospělých lidí. Důsledně je na Twitteru tweetováno zhruba 6 000 tweetů, což se týká více než 350 000 tweetů odeslaných za každý okamžik, 500 milionů tweetů za každý den a přibližně 200 miliard tweetů za každý rok.

Jak uvádí Pew Research Center, 72 % veřejnosti používá nějaký druh internetového života. Datové soubory uvolňované ze sociálních sítí jsou důležité pro řadu oborů, například pro vědu o člověku a výzkum mozku. Podpory z odborného hlediska však zdaleka nestačí a explicitní metodiky mají zoufale málo štěstí.

Analýzou jazykových markerů v příspěvcích na sociálních sítích je možné vytvořit model hlubokého učení, který dokáže člověku poskytnout náhled na jeho duševní zdraví mnohem dříve než tradiční přístupy.

Souhrnování videa sportovního utkání do textu pomocí neuronové sítě

Foto: Aksh yadav na Unsplash

Tato myšlenka projektu je v podstatě založena na získání přesného souhrnu z videí sportovních utkání. Existují sportovní webové stránky, které vyprávějí o nejzajímavějších momentech zápasu. Pro úlohu extraktivního shrnutí textu byly navrženy různé modely, ale neuronové sítě odvádějí nejlepší práci. Sumarizace zpravidla odkazuje na představení informací ve stručné struktuře, soustředění se na části, které zprostředkovávají fakta a informace, při zachování důležitosti.

Automatické vytvoření osnovy videozáznamu zápasu dává vzniknout výzvě rozlišit fascinující minuty neboli highlights zápasu.

Toho lze dosáhnout pomocí některých technik hlubokého učení, jako jsou 3D-CNN (trojrozměrné konvoluční sítě), RNN (rekurentní neuronové sítě), LSTM (sítě s dlouhodobou krátkodobou pamětí) a také pomocí algoritmů strojového učení rozdělením videa na různé části a následným použitím SVM (Support vector machines), NN (neuronové sítě), algoritmu k-means.

Pro lepší pochopení si podrobně prostudujte přiložené články.

Rozpoznávání ručně psaných rovnic pomocí CNN

Foto: Antoine Dautry na Unsplash

Mezi všemi problémy je rozpoznávání ručně psaných matematických výrazů jedním z nejasných problémů v oblasti výzkumu počítačového vidění. Řešitele ručně psaných rovnic můžete trénovat podle ručně psaných číslic a matematických symbolů pomocí konvoluční neuronové sítě (CNN) s některými technikami zpracování obrazu. Vývoj takového systému vyžaduje trénování našich strojů pomocí dat, aby se mohly zdatně učit a provádět požadované předpovědi.

Pro lepší pochopení si přečtěte níže přiložené články.

Generování shrnutí obchodní schůzky pomocí NLP

Foto: Sebastian Herrmann na Unsplash

Už jste se někdy dostali do situace, kdy všichni chtěli vidět shrnutí, a ne celé zprávy. No, setkal jsem se s tím během svých školních a vysokoškolských let, kdy jsme strávili spoustu času přípravou celé zprávy, ale učitel měl čas přečíst pouze shrnutí.

Shrnutí vyvstalo jako neúprosně užitečný způsob, jak řešit problém přetížení daty. Získávání informací z rozhovorů může mít velmi dobrou komerční i vzdělávací hodnotu. Toho lze dosáhnout zachycením rysů statistických, jazykových a pocitových aspektů se strukturou dialogu konverzace.

Ruční změna zprávy do sumarizované podoby je příliš časově náročná, není-liž pravda? Lze se však spolehnout na techniky zpracování přirozeného jazyka (NLP).

Sumarizace textu pomocí hlubokého učení dokáže pochopit kontext celého textu. Není to splněný sen nás všech, kteří potřebujeme vytvořit rychlé shrnutí dokumentu !!!

Pro lepší pochopení si přečtěte níže přiložené články.

Rozpoznávání obličeje k rozpoznání nálady a navrhování písní podle toho

Foto: Alireza Attari na Unsplash

Lidská tvář je důležitou součástí těla jedince a hraje významnou roli zejména při poznávání duševního stavu člověka. Odpadá tak nudné a zdlouhavé ruční vyčleňování nebo seskupování skladeb do různých záznamů a pomáhá při vytváření vhodného seznamu skladeb na základě emocionálních vlastností jedince.

Lidé mají tendenci poslouchat hudbu podle své nálady a zájmů. Lze vytvořit aplikaci, která bude uživatelům navrhovat skladby na základě jejich nálady zachycením výrazů obličeje.

Počítačové vidění je interdisciplinární obor, který pomáhá zprostředkovat počítačům porozumění digitálním obrazům nebo videím na vysoké úrovni. komponenty počítačového vidění lze použít k určení emocí uživatele prostřednictvím výrazů obličeje.

Existují také tato API, která mi přišla zajímavá a užitečná, i když jsem na nich nepracoval, ale přikládám je zde s nadějí, že vám pomohou.

Zjišťování obyvatelných exoplanet ze snímků pořízených kosmickými přístroji jako Kepler

Foto: Nick Owuor (astro.nic.visuals) na Unsplash

V posledním desetiletí bylo za účelem identifikace tranzitujících planet sledováno přes milion hvězd. Ruční interpretace potenciálních kandidátů na exoplanety je pracná a podléhá lidské chybě, jejíž důsledky lze jen těžko vyhodnotit. Konvoluční neuronové sítě jsou vhodné pro identifikaci exoplanet podobných Zemi v zašuměných datech časových řad s výraznější přesností než strategie nejmenších čtverců.

Regenerace obrazu pro starý poškozený snímek z kotouče

Zdroj Pikist

Vím, jak časově náročné a bolestivé je získat zpět svou starou poškozenou fotografii v původní podobě, v jaké byla dříve. Takže to lze provést pomocí hlubokého učení tak, že se najdou všechny vady obrazu (zlomy, oděrky, díry) a pomocí algoritmů Inpainting lze snadno odhalit vady na základě hodnot pixelů v jejich okolí a obnovit a obarvit staré fotografie.

Generování hudby pomocí hlubokého učení

Foto: Abigail Keenan na Unsplash

Hudba je sortiment tónů různých frekvencí. Automatické generování hudby je tedy proces skládání krátké hudební skladby s co nejmenším lidským zprostředkováním . V poslední době se špičkou v oblasti programovaného generování hudby stalo inženýrství hlubokého učení (Deep Learning).

KONEČNÉ SLOVO

Vím, že vybudovat skvělé portfolio datových věd je opravdový boj. Ale s takovou sbírkou, kterou jsem poskytl výše, můžete v této oblasti udělat nadprůměrný pokrok. Sbírka je nová, což dává příležitost i pro výzkumné účely. Takže i výzkumníci v oblasti datové vědy si mohou vybrat tyto nápady, na kterých budou pracovat, aby jejich výzkum byl pro datové vědce velkou pomocí při zahájení projektu. A navíc Je to skutečná zábava prozkoumat strany, které nikdo předtím neudělal.
Ačkoli, tato sbírka je vlastně tvoří nápady od začátku až po pokročilou úroveň.

Takže, budu doporučovat nejen pro nováčky v oblasti datové vědy, ale také starší datové vědce. Otevře vám mnoho nových cest během vaší kariéry, a to nejen díky projektům, ale také díky nově získaným kontaktům.

Tyto nápady vám ukážou širokou škálu možností a dají vám nápady, jak myslet out of the box.

Pro mě a mé přátele jsou důležité faktory učení, přidávání hodnoty společnosti a neprozkoumané znalosti a svým způsobem i zábava. Takže mě v podstatě baví dělat takové projekty, které nám dávají možnost získat svým způsobem obrovské znalosti a umožňují nám prozkoumat neprobádané dimenze. Na to se zaměřujeme především, když věnujeme čas takovým projektům.

admin

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

lg