De Kajal Yadav, un scriitor independent despre știința datelor, startup-uri & antreprenoriat.
Sursa Unsplash, editată de autor.
Ești entuziasmat să intri în lumea științei datelor? Felicitări! Aceasta este încă alegerea corectă din cauza impulsului suprem în ceea ce privește nevoia de muncă făcută în Știința Datelor și Inteligența Artificială în timpul acestei pandemii.
Deși, din cauza crizei, piața devine în prezent mai dură pentru a o putea înființa din nou cu mai multă forță de oameni, așa cum o fac mai devreme. Deci, Este posibil să fie posibil să trebuiască să vă pregătiți mental pentru călătoria de angajare pe termen lung și multe respingeri pe parcurs.
Acum, în timp ce scriu acest articol, presupun că știți deja că un portofoliu de știință a datelor este crucial și cum să îl construiți.
S-ar putea să vă petreceți cea mai mare parte a timpului făcând crunching de date și wrangling și nu aplicând modele fanteziste.
O întrebare pe care mi-au pus-o în mod repetat entuziaștii științei datelor este aceea de a ști ce fel de proiecte ar trebui să includă în portofoliul lor pentru a construi un portofoliu extraordinar de bun și unic.
Mai jos vă dau 8 idei unice pentru portofoliul dvs. de știință a datelor cu articole de referință atașate din care veți obține informații despre cum să începeți cu orice idee particulară.
- Analiza sentimentală pentru depresie pe baza postărilor din social media
- Sports match video to text summarization using neural network
- Soluționator de ecuații scrise de mână folosind CNN
- Generarea rezumatului unei întâlniri de afaceri folosind NLP
- Recunoașterea facială pentru a detecta starea de spirit și a sugera cântece în consecință
- Descoperirea unor exoplanete locuibile din imaginile captate de vehicule spațiale precum Kepler
- Regenerarea imaginii pentru vechea fotografie deteriorată a rolei
- Generarea de muzică cu ajutorul învățării profunde
- FINAL WORD
Fotografie de dole777 pe Unsplash.
Acest subiect este atât de sensibil pentru a fi luat în considerare în zilele noastre și în nevoia urgentă de a face ceva despre el. În întreaga lume există peste 264 de milioane de persoane care suferă de depresie. Depresia este principala cauză a dizabilității la nivel mondial și este un susținător semnificativ al poverii globale a bolilor, iar aproape 800.000 de persoane mușcă praful în mod constant din cauza sinuciderii în fiecare an. Sinuciderea este al doilea motiv principal de deces la persoanele cu vârste cuprinse între 15 și 29 de ani. Tratamentul pentru depresie este adesea întârziat, imprecis sau ratat în întregime.
Viața bazată pe internet oferă principala șansă de margine pentru a schimba serviciile de mediere timpurie a melancoliei, în special la adulții tineri. În mod constant, aproximativ 6.000 de tweet-uri sunt transmise pe Twitter, ceea ce se referă la mai mult de 350.000 de tweet-uri trimise pentru fiecare moment, 500 de milioane de tweet-uri pentru fiecare zi și aproximativ 200 de miliarde de tweet-uri pentru fiecare an.
După cum indică Pew Research Center, 72% din public utilizează un fel de viață bazată pe internet. Seturile de date eliberate de rețelele sociale sunt importante pentru numeroase domenii, de exemplu, științele umane și cercetarea creierului. Dar suporturile din punct de vedere specializat sunt departe de a fi suficiente, iar metodologiile explicite sunt cu disperare lipsite de noroc.
Analizând markerii lingvistici din postările din rețelele de socializare, este posibil să se creeze un model de învățare profundă care poate oferi unei persoane o perspectivă asupra sănătății sale mintale mult mai devreme decât abordările tradiționale.
- You Are What You Tweet – Detecting Depression in Social Media via Twitter Usage
- Early Detection of Depression: Social Network Analysis and Random Forest Techniques – lucrare originală, Universitatea din A Coruna.
- Detection of Depression from social network data using machine learning techniques
Sports match video to text summarization using neural network
Photo by Aksh yadav on Unsplash.
Atunci această idee de proiect se bazează în principiu pe obținerea unui rezumat precis din videoclipurile meciurilor sportive. Există site-uri de sport care povestesc despre momentele importante ale meciului. Au fost propuse diverse modele pentru sarcina de rezumare extractivă a textului, dar rețelele neuronale fac cea mai bună treabă. De regulă, rezumatul face aluzie la introducerea informațiilor într-o structură scurtă, concentrându-se pe părțile care transmit fapte și informații, păstrând în același timp importanța.
Crearea automată a unui rezumat al unui videoclip de meci dă naștere la provocarea de a distinge minutele fascinante sau punctele culminante ale unui meci.
Deci, se poate realiza acest lucru folosind unele tehnici de învățare profundă, cum ar fi 3D-CNN (rețele convoluționale tridimensionale), RNN (rețele neuronale recurente), LSTM (rețele de memorie pe termen scurt) și, de asemenea, prin intermediul algoritmilor de învățare automată prin împărțirea videoclipului în diferite secțiuni și apoi prin aplicarea algoritmilor SVM (Support vector machines), NN (rețele neuronale) și k-means.
Pentru o mai bună înțelegere, consultați în detaliu articolul atașat.
- Scene Classification for Sports Video Summarization Using Transfer Learning – Această lucrare propune o metodă nouă pentru clasificarea scenelor video sportive.
Soluționator de ecuații scrise de mână folosind CNN
Fotografie de Antoine Dautry pe Unsplash.
Printre toate problemele, recunoașterea expresiilor matematice scrise de mână este una dintre problemele confuze din regiunea cercetării în domeniul vederii computerizate. Puteți antrena un rezolvator de ecuații scrise de mână prin intermediul cifrelor și simbolurilor matematice scrise de mână folosind rețeaua neuronală convoluțională (CNN) cu ajutorul unor tehnici de prelucrare a imaginilor. Dezvoltarea unui astfel de sistem necesită antrenarea mașinilor noastre cu date, făcându-le pricepute în a învăța și a face predicția necesară.
Consultați articolele atașate mai jos pentru o mai bună înțelegere.
- Handwritten Equation Solver using Convolutional Neural Network
- vipul79321/Handwritten-Equation-Solver – An Handwritten Equation Solver using CNN Ecuația poate conține orice cifră de la 0-9 și simbol.
- Computer Vision – Autoevaluarea foilor de răspuns matematice scrise de mână – Digitizarea etapelor de rezolvare a unei ecuații matematice scrise de mână liberă pe o hârtie.
- Ecuații scrise de mână în LaTeX
Generarea rezumatului unei întâlniri de afaceri folosind NLP
Fotografie de Sebastian Herrmann pe Unsplash.
Ați fost vreodată blocat într-o situație în care toată lumea vrea să vadă un rezumat și nu raportul complet? Ei bine, m-am confruntat cu această situație în timpul școlii și al facultății, când am petrecut mult timp pregătind un raport complet, dar profesorul are timp să citească doar rezumatul.
Sumarizarea a apărut ca o modalitate inexorabil de ajutor pentru a aborda problema supraîncărcării cu date. Extragerea de informații din conversații poate avea o valoare comercială și educațională foarte bună. Acest lucru se poate realiza prin captarea caracteristicilor aspectelor statistice, lingvistice și sentimentale cu structura dialogului conversației.
Modificarea manuală a raportului într-o formă rezumativă este prea lungă, nu-i așa? Dar ne putem baza pe tehnicile de procesare a limbajului natural (NLP) pentru a realiza acest lucru.
Rezumarea textului cu ajutorul învățării profunde poate înțelege contextul întregului text. Nu este un vis devenit realitate pentru toți cei care trebuie să realizeze un rezumat rapid al unui document!
Referiți-vă la articolele atașate mai jos pentru o mai bună înțelegere.
- Ghid cuprinzător pentru rezumarea textului folosind Deep Learning în Python – „Nu vreau un raport complet, dați-mi doar un rezumat al rezultatelor.”
- Înțelegeți rezumarea textului și creați-vă propriul rezumator în python – Rezumarea poate fi definită ca o sarcină de a produce un rezumat concis și fluent, păstrând în același timp informațiile cheie.
Recunoașterea facială pentru a detecta starea de spirit și a sugera cântece în consecință
Fotografie de Alireza Attari pe Unsplash.
Fața umană este o parte importantă a corpului unui individ și joacă în special un rol semnificativ în cunoașterea stării de spirit a unei persoane. Acest lucru elimină sarcina plictisitoare și plictisitoare de a izola sau de a grupa manual melodiile în diferite înregistrări și ajută la generarea unei liste de redare adecvate pe baza caracteristicilor emoționale ale unui individ.
Oamenii au tendința de a asculta muzică în funcție de starea lor de spirit și de interese. Se poate crea o aplicație care să sugereze melodii pentru utilizatori în funcție de starea lor de spirit prin captarea expresiilor faciale.
Viziunea pe calculator este un domeniu interdisciplinar care ajută la transmiterea unei înțelegeri de nivel înalt a imaginilor digitale sau a videoclipurilor către calculatoare. Componentele de viziune computerizată pot fi folosite pentru a determina emoția utilizatorului prin intermediul expresiilor faciale.
Există și aceste API-uri, care mi s-au părut interesante și utile. Cu toate acestea, nu am lucrat la acestea, dar atașez aici cu speranța că acestea vă vor ajuta.
- 20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | Nordic APIs – Dacă afacerile ar putea simți emoțiile folosind tehnologia în orice moment, ar putea profita de ele pentru a le vinde consumatorilor.
Descoperirea unor exoplanete locuibile din imaginile captate de vehicule spațiale precum Kepler
Fotografie de Nick Owuor (astro.nic.visuals) pe Unsplash.
În cel mai recent deceniu, peste un milion de stele au fost monitorizate pentru a identifica planete în tranzit. Interpretarea manuală a potențialelor candidate la exoplanete necesită multă muncă și este supusă erorilor umane, ale căror consecințe sunt greu de evaluat. Rețelele neuronale convoluționale sunt potrivite pentru a identifica exoplanete asemănătoare Pământului în date cu serii temporale zgomotoase, cu o precizie mai proeminentă decât o strategie cu cele mai mici pătrate.
- Exoplanet hunting using Machine Learning – Hunting worlds beyond our solar system.
- Inteligență artificială, date NASA folosite pentru a descoperi o exoplanetă – Sistemul nostru solar este acum la egalitate pentru cel mai mare număr de planete în jurul unei singure stele.
Regenerarea imaginii pentru vechea fotografie deteriorată a rolei
Sursa Pikist.
Știu cât de mult timp și cât de dureros este să vă recuperați vechea fotografie deteriorată în forma originală, așa cum a fost mai devreme. Deci, acest lucru se poate face folosind învățarea profundă prin găsirea tuturor defectelor imaginii (fracturi, zgârieturi, găuri) și folosind algoritmi de vopsire, astfel încât să se poată descoperi cu ușurință defectele pe baza valorilor pixelilor din jurul lor pentru a restaura și colora fotografiile vechi.
- Colorarea și restaurarea imaginilor vechi cu ajutorul învățării profunde – Colorarea imaginilor alb-negru cu ajutorul învățării profunde a devenit o vitrină impresionantă pentru aplicația din lumea reală.
- Guide to Image Inpainting: Utilizarea învățării automate pentru a edita și corecta defectele din fotografii
- Cum să efectuați restaurarea imaginilor Absolut gratuit DataSet
Generarea de muzică cu ajutorul învățării profunde
Fotografie de Abigail Keenan pe Unsplash.
Muzica este un sortiment de tonuri de diferite frecvențe. Așadar, generarea automată a muzicii este un proces de compunere a unei piese muzicale scurte cu cea mai mică mediere umană. Recent, ingineria de învățare profundă a devenit vârful de lance pentru generarea programată a muzicii.
- Generarea muzicii folosind Deep Learning
- How to Generate Music using a LSTM Neural Network in Keras – An introduction to creating music using LSTM Neural Networks
FINAL WORD
Știu că este o adevărată luptă să construiești un portofoliu cool de știință a datelor. Dar cu o astfel de colecție pe care v-am oferit-o mai sus, puteți face progrese peste medie în acest domeniu. Colecția este nouă, ceea ce oferă posibilitatea de a o folosi și în scopuri de cercetare. Deci, cercetătorii în știința datelor pot alege, de asemenea, aceste idei pentru a lucra la ele, astfel încât cercetarea lor să fie de mare ajutor pentru cercetătorii de date pentru a începe cu proiectul. În plus, este distractiv să explorezi laturile pe care nimeni nu le-a mai făcut până acum. Deși, această colecție constituie de fapt idei de la nivel începător până la nivel avansat.
Deci, nu voi recomanda acest lucru doar pentru începători în domeniul științei datelor, ci și pentru cercetătorii de date seniori. Vă va deschide multe căi noi pe parcursul carierei, nu numai datorită proiectelor, ci și prin rețeaua nou dobândită.
Aceste idei vă arată gama largă de posibilități și vă oferă idei pentru a gândi în afara cutiei.
Pentru mine și pentru prietenii mei, factorii de învățare, adăugarea de valoare pentru societate și cunoștințele neexplorate sunt importante, iar distracția, într-un fel, este esențială. Deci, practic, îmi place să fac astfel de proiecte care ne oferă o modalitate de a dobândi cunoștințe imense într-un fel și ne permit să explorăm dimensiunile neexplorate. Acesta este principalul nostru obiectiv atunci când ne dedicăm timpul unor astfel de proiecte.
Original. Reprodus cu permisiune.
Bio: Kajal Yadav este un scriitor independent specializat în știința datelor, startup-uri și antreprenoriat. Ea scrie pentru mai multe publicații și, în același timp, lucrează cu startup-uri la strategiile lor de marketing de conținut.
Relații:
- Începeți cariera de Machine Learning în carantină
- Proiecte pe care să le includeți într-un portofoliu de știință a datelor
- Cum să construiți un portofoliu de știință a datelor
.