Er du spændt på at komme ind i Data Science-verdenen?
Godt tillykke! Det er stadig det rigtige valg på grund af den ultimative stigning i behovet for arbejde udført i Data Science og kunstig intelligens i løbet af denne pandemi.

Men på grund af krisen bliver markedet i øjeblikket hårdere for at kunne oprette det igen med flere mænd kraft, som de gør tidligere. Så det kan være muligt, at du skal forberede dig mentalt på langvarig ansættelsesrejse og mange afvisninger på en måde.

Dermed, mens jeg skriver denne artikel, går jeg ud fra, at du allerede har vidst, at data-science-portefølje er afgørende, og hvordan man opbygger den.
Du bruger måske det meste af din tid, gør data crunching og wrangling og ikke anvender fancy modeller.

Et spørgsmål, som jeg har spurgt om og om igen af data science entusiaster er, at hvilken slags projekter skal de inkludere i deres portefølje for at opbygge enormt god og unik portefølje.

Nedenfor har jeg givet de 8 unikke ideer til din data science-portefølje med vedhæftede referenceartikler, hvorfra du vil få indsigt i, hvordan du kan komme i gang med en bestemt idé.

Foto af dole777 på Unsplash

Dette emne er så følsomt at blive overvejet nu til dags og i presserende behov for at gøre noget ved det. Der er mere end 264 millioner mennesker på verdensplan, som lider af depression. Depression er den vigtigste årsag til invaliditet på verdensplan og er en betydelig bidragyder til den samlede globale sygdomsbyrde, og næsten 800 000 personer bider konsekvent i støvet på grund af selvmord hvert år. Selvmord er den næststørste dødsårsag blandt de 15-29-årige. Behandling af depression er ofte forsinket, upræcis og/eller helt overset.

Internetbaseret liv giver den vigtigste kant chance for at ændre tidlige melankoliformidlingstjenester, især hos ungdommelige voksne. Konstant bliver der tweetet ca. 6.000 tweets på Twitter, hvilket relaterer til mere end 350.000 tweets sendt for hvert øjeblik, 500 millioner tweets for hver dag og omkring 200 milliarder tweets for hvert år.

Som angivet af Pew Research Center bruger 72% af offentligheden en eller anden form for internetbaseret liv. Datasæt, der frigives fra sociale netværk, er vigtige for mange områder, f.eks. humanvidenskab og hjerneforskning. Men understøttelserne fra et specialiseret synspunkt er langt fra tilstrækkelige, og eksplicitte metoder er desperat uheldige.

Gennem analyse af sproglige markører i indlæg på sociale medier er det muligt at skabe en deep learning-model, der kan give en person indsigt i hans eller hendes mentale helbred langt tidligere end traditionelle tilgange.

Sports match video to text summarization using neural network

Foto af Aksh yadav på Unsplash

Så denne projektidé er grundlæggende baseret på at få et præcist resumé ud af Sports match videoer. Der er sportswebsteder, der fortæller om højdepunkterne i kampen. Forskellige modeller er blevet foreslået til opgaven med ekstraktiv tekstresumé, men neurale netværk gør det bedste job. Som regel hentyder sammenfatning til at introducere information i en kort struktur og koncentrere sig om dele, der formidler fakta og information, samtidig med at vigtigheden sikres.

Automatisk at skabe en oversigt over en kampvideo giver anledning til udfordringen med at skelne fascinerende minutter, eller højdepunkter, fra en kamp.

Så man kan opnå dette ved hjælp af nogle dybe indlæringsteknikker som 3D-CNN (tredimensionale convolutionelle netværk), RNN(Recurrent neural network), LSTM (Long short term memory networks) og også gennem Machine learning algoritmer ved at opdele videoen i forskellige sektioner og derefter anvende SVM(Support vector machines), NN(Neural Networks), k-means algoritme.

For bedre forståelse henvises der til de vedlagte artikler i detaljer.

Håndskrevet ligningsløser ved hjælp af CNN

Foto af Antoine Dautry på Unsplash

Men blandt alle spørgsmål er genkendelse af håndskrevne matematiske udtryk et af de forvirrende spørgsmål inden for forskning i computervision. Du kan træne håndskrevet ligningsløser ved hjælp af håndskrevne cifre og matematiske symboler ved hjælp af Convolutional Neural Network (CNN) med nogle billedbehandlingsteknikker. Udvikling af et sådant system kræver, at vi træner vores maskiner med data, så de bliver dygtige til at lære og foretage den nødvendige forudsigelse.

Se nedenstående artikler for at få en bedre forståelse.

Generering af resuméer af forretningsmøder ved hjælp af NLP

Foto af Sebastian Herrmann på Unsplash

Er du nogensinde havnet i en situation, hvor alle ønsker at se et resumé og ikke de fulde rapporter. Jeg har selv oplevet det i min skole- og universitetstid, hvor vi brugte meget tid på at udarbejde en hel rapport, men læreren har kun tid til at læse resuméet.

Summarisering er blevet en uundgåelig nyttig måde at håndtere problemet med overbelastning af data på. Udtrækning af oplysninger fra samtaler kan være af meget god kommerciel og pædagogisk værdi. Dette kan gøres ved at indfange de statistiske, sproglige og følelsesmæssige aspekter med samtalens dialogstruktur.

Manuelt at ændre rapporten til en opsummeret form er for tidskrævende, er det ikke rigtigt? Men man kan stole på Natural Language Processing (NLP) teknikker til at opnå dette.

Tekstsammenfatning ved hjælp af deep learning kan forstå konteksten i hele teksten. Er det ikke en drøm, der går i opfyldelse for alle os, der har brug for at komme med et hurtigt resumé af et dokument !!

Se nedenstående artikler for en bedre forståelse.

Facial genkendelse til at registrere humør og foreslå sange i overensstemmelse hermed

Foto af Alireza Attari på Unsplash

Det menneskelige ansigt er en vigtig del af en persons krop, og det spiller især en væsentlig rolle for at kende en persons sindstilstand. Dette eliminerer den kedelige og kedelige opgave med manuelt at isolere eller gruppere sange i forskellige plader og hjælper med at generere en passende spilleliste baseret på en persons følelsesmæssige træk.

Mennesker har en tendens til at lytte til musik baseret på deres humør og interesser. Man kan oprette en applikation til at foreslå sange til brugere baseret på deres humør ved at registrere ansigtsudtryk.

Computervision er et tværfagligt område, der hjælper med at formidle en forståelse på højt niveau af digitale billeder eller videoer til computere. computervisionskomponenter kan bruges til at bestemme brugerens følelser gennem ansigtsudtryk.

Der er også disse API’er, som jeg fandt interessante og nyttige, selv om jeg ikke arbejdede på disse, men vedhæfter dem her med et håb om, at de vil hjælpe dig.

Finding out habitable exo-planet from images captured by space vehicles like Kepler

Photo by Nick Owuor (astro.nic.visuals) on Unsplash

I det seneste årti blev over en million stjerner overvåget for at identificere transiterende planeter. Manuel fortolkning af potentielle exoplanetkandidater er arbejdskrævende og udsat for menneskelige fejl, hvis konsekvenser er svære at vurdere. Konvolutionelle neurale netværk er velegnede til at identificere jordlignende exoplaneter i støjende tidsseriedata med en mere fremtrædende præcision end en strategi baseret på mindste kvadrater.

Billedgenoprettelse til gammelt beskadiget rullebillede

Kilde Pikist

Jeg ved, hvor tidskrævende og smertefuldt det er at få dit gamle beskadigede foto tilbage i den oprindelige form, som det var tidligere. Så dette kan gøres ved hjælp af deep learning ved at finde alle billeddefekter (brud, skrammer, huller), og ved hjælp af Inpainting-algoritmer kan man nemt opdage defekterne baseret på pixelværdierne omkring dem for at gendanne og farvelægge de gamle fotos.

Musikgenerering ved hjælp af deep learning

Foto af Abigail Keenan på Unsplash

Musik er et sammensurium af toner af forskellige frekvenser. Så den automatiske musikgenerering er en proces til at komponere et kort stykke musik med mindst mulig menneskelig formidling . For nylig er Deep Learning-teknik blevet banebrydende for programmeret Music Generation.

FINAL WORD

Jeg ved, at det er en reel kamp at opbygge en cool data science-portefølje. Men med en sådan samling, som jeg har givet ovenfor, kan du gøre over gennemsnittet fremskridt på det område. Samlingen er ny, hvilket også giver mulighed for forskningsformål. Så forskere i Data-Science kan også vælge disse ideer til at arbejde på, så deres forskning ville være en stor hjælp for Data Scientists til at starte med projekt. Og desuden Det er en rigtig sjov at udforske de sider, som ingen har gjort før.
Men denne samling er faktisk udgør af ideer fra begyndelsen til avanceret niveau.

Så jeg vil ikke kun anbefale dette til nybegyndere inden for data science-området, men også senior dataloger. Den vil åbne mange nye veje i løbet af din karriere, ikke kun på grund af projekterne, men også gennem det nyligt opnåede netværk.

Disse idéer viser dig den brede vifte af muligheder og giver dig ideer til at tænke ud af boksen.

For mig og mine venner er læringsfaktorerne, at tilføre værdi til samfundet og den uudforskede viden vigtig, og det sjove på en måde er afgørende. Så dybest set nyder jeg at lave sådanne projekter, som giver os mulighed for at opnå enorm viden på en måde og lader os udforske de uudforskede dimensioner. Det er vores hovedfokus, når vi dedikerer tid til sådanne projekter.

admin

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

lg