Ești entuziasmat să intri în lumea științei datelor?
Congrats! Aceasta este încă alegerea corectă din cauza impulsului final al nevoii de muncă făcută în Știința Datelor și Inteligența Artificială în timpul acestei pandemii.

Deși, din cauza crizei, piața devine în prezent mai dură pentru a o putea înființa din nou cu mai multă forță de oameni, așa cum o fac mai devreme. Deci, Ar putea fi posibil ca tu să trebuiască să te pregătești mental pentru o călătorie de angajare pe termen lung și multe respingeri într-un fel.

Acum, în timp ce scriu acest articol, presupun că ați știut deja că portofoliul de știință a datelor este crucial și cum să îl construiți.
S-ar putea să vă petreceți cea mai mare parte a timpului, făcând crunching și wrangling de date și nu aplicând modele fanteziste.

O întrebare pe care am întrebat-o la nesfârșit de către entuziaștii științei datelor este că ce fel de proiecte ar trebui să includă în portofoliul lor pentru a construi un portofoliu extraordinar de bun și unic.

Mai jos am dat cele 8 idei unice pentru portofoliul dvs. de știință a datelor cu articole de referință atașate din care veți obține informații despre cum să începeți cu orice idee particulară.

Photo by dole777 on Unsplash

Acest subiect este atât de sensibil pentru a fi luat în considerare în zilele noastre și în nevoie urgentă de a face ceva despre el. La nivel mondial există peste 264 de milioane de persoane care suferă de depresie. Depresia este principala cauză a dizabilității la nivel mondial și este un susținător semnificativ al poverii globale a bolilor, iar aproape 800.000 de persoane mușcă praful în mod constant din cauza sinuciderii în fiecare an. Sinuciderea este al doilea motiv principal de deces la persoanele cu vârste cuprinse între 15 și 29 de ani. Tratamentul pentru depresie este adesea întârziat, imprecis și/sau ratat în întregime.

Viața bazată pe internet oferă principala șansă de margine pentru a schimba serviciile de mediere timpurie a melancoliei, în special la adulții tineri. În mod constant, aproximativ 6.000 de tweet-uri sunt transmise pe Twitter, ceea ce se referă la mai mult de 350.000 de tweet-uri trimise pentru fiecare moment, 500 de milioane de tweet-uri pentru fiecare zi și aproximativ 200 de miliarde de tweet-uri pentru fiecare an.

După cum indică Pew Research Center, 72% din public utilizează un fel de viață bazată pe internet. Seturile de date eliberate de rețelele sociale sunt importante pentru numeroase domenii, de exemplu, științele umane și cercetarea creierului. Dar suporturile din punct de vedere specializat sunt departe de a fi suficiente, iar metodologiile explicite sunt cu disperare lipsite de noroc.

Analizând markerii lingvistici din postările din rețelele de socializare, este posibil să se creeze un model de învățare profundă care poate oferi unei persoane o perspectivă asupra sănătății sale mintale mult mai devreme decât abordările tradiționale.

Sport match video to text summarization using neural network

Fotografie de Aksh yadav pe Unsplash

Așa că această idee de proiect se bazează în principiu pe obținerea unui rezumat precis din videoclipurile meciurilor sportive. Există site-uri de sport care relatează despre cele mai importante momente ale meciului. Au fost propuse diverse modele pentru sarcina de rezumare extractivă a textului, dar rețelele neuronale fac cea mai bună treabă. De regulă, rezumarea face aluzie la introducerea informației într-o structură scurtă, concentrându-se pe părțile care transmit fapte și informații, păstrând în același timp importanța.

Crearea automată a unui rezumat al unui videoclip de meci dă naștere provocării de a distinge minutele fascinante, sau punctele culminante, ale unui meci.

Atunci, se poate realiza acest lucru folosind unele tehnici de învățare profundă, cum ar fi 3D-CNN (rețele convoluționale tridimensionale), RNN(rețea neuronală recurentă), LSTM (rețele de memorie pe termen scurt) și, de asemenea, prin algoritmi de învățare automată prin împărțirea videoclipului în diferite secțiuni și apoi prin aplicarea algoritmului SVM(Support vector machines), NN(rețele neuronale), k-means.

Pentru o mai bună înțelegere, consultați în detaliu articolele atașate.

Soluționator de ecuații scrise de mână folosind CNN

Fotografie de Antoine Dautry pe Unsplash

Printre toate problemele, recunoașterea expresiilor matematice scrise de mână este una dintre problemele confuze din regiunea cercetării în domeniul vederii computerizate. Puteți antrena rezolvatorul de ecuații scrise de mână cu ajutorul cifrelor scrise de mână și al simbolurilor matematice folosind rețeaua neuronală convoluțională (CNN) cu ajutorul unor tehnici de prelucrare a imaginilor. Dezvoltarea unui astfel de sistem necesită antrenarea mașinilor noastre cu date, făcându-le competente să învețe și să facă predicția necesară.

Referiți-vă la articolele atașate mai jos pentru o mai bună înțelegere.

Generarea rezumatului unei întâlniri de afaceri folosind NLP

Fotografie de Sebastian Herrmann pe Unsplash

Ați fost vreodată blocat într-o situație, în care toată lumea vrea să vadă un rezumat și nu rapoarte complete. Ei bine, m-am confruntat cu această situație în timpul școlii și al facultății, când petreceam mult timp pregătind un raport complet, dar profesorul avea timp să citească doar rezumatul.

Sumarizarea a apărut ca o modalitate inexorabil de ajutor pentru a aborda problema supraîncărcării cu date. Extragerea de informații din conversații poate avea o valoare comercială și educațională foarte bună. Acest lucru se poate face prin captarea caracteristicilor aspectelor statistice, lingvistice și sentimentale cu structura dialogului conversației.

Modificarea manuală a raportului într-o formă rezumată este prea consumatoare de timp, nu-i așa? Dar cineva se poate baza pe tehnicile de procesare a limbajului natural (NLP) pentru a realiza acest lucru.

Rezumarea textului cu ajutorul învățării profunde poate înțelege contextul întregului text. Nu-i așa că este un vis devenit realitate pentru toți cei care trebuie să realizeze un rezumat rapid al unui document !!

Referiți-vă la articolele atașate mai jos pentru o mai bună înțelegere.

Recunoașterea facială pentru a detecta starea de spirit și a sugera cântece în consecință

Fotografie de Alireza Attari pe Unsplash

Fața umană este o parte importantă a corpului unui individ și joacă în special un rol semnificativ în cunoașterea stării de spirit a unei persoane. Acest lucru elimină sarcina plictisitoare și plictisitoare de a izola sau de a grupa manual melodiile în diferite înregistrări și ajută la generarea unei liste de redare adecvate pe baza caracteristicilor emoționale ale unui individ.

Oamenii au tendința de a asculta muzică în funcție de starea lor de spirit și de interese. Se poate crea o aplicație care să sugereze melodii pentru utilizatori în funcție de starea lor de spirit prin captarea expresiilor faciale.

Viziunea computerizată este un domeniu interdisciplinar care ajută la transmiterea unei înțelegeri de nivel înalt a imaginilor digitale sau a videoclipurilor către computere. componentele de viziune computerizată pot fi utilizate pentru a determina emoția utilizatorului prin expresiile faciale.

Există și aceste API-uri pe care le-am găsit interesante și utile, deși nu am lucrat la ele, dar le atașez aici cu speranța că vă vor fi de ajutor.

Descoperirea exo-planetelor locuibile din imaginile capturate de vehicule spațiale precum Kepler

Fotografie de Nick Owuor (astro.nic.visuals) on Unsplash

În cel mai recent deceniu, peste un milion de stele au fost monitorizate pentru a identifica planetele în tranzit. Interpretarea manuală a potențialelor candidate la exoplanete necesită multă muncă și este supusă erorilor umane, ale căror consecințe sunt greu de evaluat. Rețelele neuronale convoluționale sunt potrivite pentru a identifica exoplanete asemănătoare Pământului în datele de serii temporale zgomotoase, cu o precizie mai proeminentă decât o strategie cu cele mai mici pătrate.

Regenerarea imaginii pentru vechea poză deteriorată de pe rolă

Sursa Pikist

Știu, cât de mult timp și cât de dureros este să îți recuperezi vechea poză deteriorată în forma originală, așa cum era mai devreme. Așadar, acest lucru se poate face cu ajutorul învățării profunde prin găsirea tuturor defectelor imaginii (fracturi, zgârieturi, găuri), iar cu ajutorul algoritmilor Inpainting, se pot descoperi cu ușurință defectele pe baza valorilor pixelilor din jurul lor pentru a restaura și colora fotografiile vechi.

Generarea de muzică folosind deep learning

Fotografie de Abigail Keenan pe Unsplash

Muzica este un sortiment de tonuri de diferite frecvențe. Așadar, Generația Automată de Muzică este un proces de compunere a unei piese muzicale scurte cu cea mai mică mediere umană . Recent, ingineria Deep Learning a devenit vârful de lance pentru generarea programată a muzicii.

LUMINA FINALĂ

Știu că este o adevărată luptă să construiești un portofoliu interesant de știință a datelor. Dar cu o astfel de colecție pe care v-am oferit-o mai sus, puteți face progrese peste medie în acest domeniu. Colecția este nouă, ceea ce oferă oportunitatea și în scopuri de cercetare. Deci, cercetătorii din domeniul științei datelor pot, de asemenea, să aleagă aceste idei pentru a lucra la ele, astfel încât cercetarea lor să fie un mare ajutor pentru cercetătorii de date pentru a începe cu proiectul. Și, în plus, Este o adevărată distracție pentru a explora laturile pe care nimeni nu le-a făcut înainte.
De fapt, această colecție este de fapt constituită din idei de la nivel începător la nivel avansat.

Deci, nu voi recomanda acest lucru numai pentru începători în domeniul științei datelor, ci și pentru oamenii de știință de date seniori. Vă va deschide multe căi noi pe parcursul carierei, nu numai datorită proiectelor, ci și prin rețeaua nou dobândită.

Aceste idei vă arată gama largă de posibilități și vă oferă idei pentru a gândi în afara cutiei.

Pentru mine și pentru prietenii mei, factorii de învățare, adăugarea de valoare pentru societate și cunoștințele neexplorate sunt importante, iar distracția, într-un fel, este esențială. Deci, practic, îmi place să fac astfel de proiecte care ne oferă o modalitate de a dobândi cunoștințe imense într-un fel și ne permit să explorăm dimensiunile neexplorate. Acesta este obiectivul nostru principal atunci când ne dedicăm timpul unor astfel de proiecte.

admin

Lasă un răspuns

Adresa ta de email nu va fi publicată.

lg