డేటా సైన్స్ ఇంటర్వ్యూ ప్రశ్నలు: DS పాత్రల కోసం పూర్తి గైడ్ (2025) | కర్మ సఖ

Failed to render content. Please refresh the page. Showing plain-text fallback.

"@/కాంపోనెంట్స్/CTA" నుంచి CTA ని ఇంపోర్ట్ చేసుకోండి

డేటా సైన్స్ ఇంటర్వ్యూ ప్రశ్నలు: DS పాత్రల కోసం పూర్తి గైడ్ (2025)

చివరిగా నవీకరించబడింది: ఫిబ్రవరి 7, 2025

కీ టేక్ అవేస్ - డేటా సైన్స్ ఇంటర్వ్యూలు స్టాటిస్టిక్స్, మెషిన్ లెర్నింగ్, SQL మరియు వ్యాపార చతురతను కవర్ చేస్తాయి - భావనలను సరళంగా వివరించడం మరియు వాస్తవ ప్రపంచ సమస్యలను పరిష్కరించడం ప్రాక్టీస్ చేయడం - మాస్టర్ ఎ / బి టెస్టింగ్, ప్రయోగాత్మక రూపకల్పన మరియు కారణ నిర్ధారణ - సాంకేతిక నైపుణ్యాలు మరియు వ్యాపార ప్రభావం రెండింటిని ప్రదర్శించడం - కేస్ స్టడీస్ మరియు ప్రొడక్ట్ సెన్స్ ప్రశ్నల కొరకు సిద్ధం చేయడం

🎯 ప్రో చిట్కా: డేటా సైన్స్ ఇంటర్వ్యూలు డేటా నుండి అంతర్దృష్టులను సేకరించడానికి మరియు వ్యాపార నిర్ణయాలను నడపడానికి మీ సామర్థ్యాన్ని అంచనా వేస్తాయి. సంక్లిష్టమైన భావనలను సరళంగా వివరించడం, వ్యాపార చతురతను చూపించడం మరియు ఎండ్-టు-ఎండ్ సమస్య పరిష్కార నైపుణ్యాలను ప్రదర్శించడంపై దృష్టి పెట్టండి.

డేటా సైన్స్ ఇంటర్వ్యూ స్ట్రక్చర్

డేటా సైన్స్ ఇంటర్వ్యూలు సాధారణంగా వివిధ సామర్థ్యాలను అంచనా వేసే బహుళ రౌండ్లను కలిగి ఉంటాయి:

ఇంటర్వ్యూ రౌండ్లు: - ఫోన్ స్క్రీన్: ప్రాథమిక SQL, గణాంకాలు మరియు ప్రవర్తనా ప్రశ్నలు - టెక్నికల్ ఇంటర్వ్యూ: కోడింగ్, స్టాటిస్టిక్స్, ML అల్గోరిథంలు - కేస్ స్టడీ: వ్యాపార సమస్య పరిష్కారం మరియు ప్రదర్శన - జట్టు / నాయకత్వం: సాంస్కృతిక ఫిట్ మరియు సహకార అంచనా

మూల్యాంకన ప్రాంతాలు: - సాంకేతిక నైపుణ్యాలు: SQL, పైథాన్ / R, గణాంకాలు, మెషిన్ లెర్నింగ్ - సమస్య పరిష్కారం: విశ్లేషణాత్మక ఆలోచన మరియు పద్దతి - వ్యాపార చతురత: వ్యాపార ప్రభావం మరియు ప్రాధాన్యతలను అర్థం చేసుకోవడం - కమ్యూనికేషన్: సాంకేతికేతర వాటాదారులకు సాంకేతిక భావనలను వివరించడం

గణాంకాలు & సంభావ్యత ప్రశ్నలు

ప్రాథమిక గణాంకాలు

1. టైప్ I మరియు టైప్ II దోషాల మధ్య తేడాను వివరించండి.

జవాబు: - టైప్ I లోపం (తప్పుడు పాజిటివ్): శూన్య పరికల్పన నిజం అయినప్పుడు తిరస్కరించడం (α లోపం) - టైప్ II లోపం (తప్పుడు ప్రతికూలత): శూన్య పరికల్పన తప్పు అయినప్పుడు తిరస్కరించడంలో విఫలం కావడం (β లోపం)

ఉదాహరణ: స్పామ్ గుర్తింపులో: - టైప్ I: చట్టబద్ధమైన ఇమెయిల్ ను స్పామ్ గా గుర్తించడం - టైప్ II: తప్పిపోయిన స్పామ్ ఇమెయిల్ (దానిని అనుమతించడం)

పవర్ = 1 - β (తప్పుడు శూన్య పరికల్పనను సరిగ్గా తిరస్కరించే సంభావ్యత)

2. p-విలువ అంటే ఏమిటి మరియు మీరు దానిని ఎలా అర్థం చేసుకుంటారు?

జవాబు: P-విలువ అనేది గమనించిన డేటా వలె విపరీతమైన (లేదా మరింత తీవ్రమైన) డేటాను గమనించే సంభావ్యత, శూన్య పరికల్పన నిజమని భావించడం.

వ్యాఖ్యానం: - p 10 మల్టీకోలినెరిటీని సూచిస్తుంది - సాధారణత కోసం Q-Q ప్లాట్లు

మెషిన్ లెర్నింగ్ ప్రశ్నలు

ML ఫండమెంటల్స్

1. బయాస్-వేరియన్స్ ట్రేడ్ ఆఫ్ గురించి వివరించండి.

జవాబు: - పక్షపాతం: ఊహాగానాలను సరళీకృతం చేయడంలో లోపం (అండర్ ఫిట్టింగ్) - వైవిధ్యం: శిక్షణా డేటాకు సున్నితత్వం నుండి లోపం (ఓవర్ ఫిట్టింగ్) - ట్రేడ్ ఆఫ్: తక్కువ పక్షపాతం ఉన్న నమూనాలు అధిక వ్యత్యాసాన్ని కలిగి ఉంటాయి, మరియు దీనికి విరుద్ధంగా ఉంటాయి

ఉదాహరణలు: - అధిక పక్షపాతం: నాన్-లీనియర్ డేటాపై లీనియర్ రిగ్రెషన్ - అధిక వ్యత్యాసం: ఓవర్ ఫిట్టింగ్ డెసిషన్ ట్రీ

పరిష్కారాలు: రెండింటినీ అంచనా వేయడానికి క్రాస్-ధ్రువీకరణ - వైవిధ్యాన్ని తగ్గించడానికి క్రమబద్ధీకరణ (L1 / L2) రెండింటినీ తగ్గించడానికి సమిష్టి పద్ధతులు

2. క్రాస్ వాలిడేషన్ అంటే ఏమిటి మరియు ఇది ఎందుకు ముఖ్యమైనది?

జవాబు: క్రాస్-ధ్రువీకరణ మోడల్ పనితీరును అంచనా వేయడానికి మరియు ఓవర్ ఫిట్టింగ్ ను నివారించడానికి డేటాను శిక్షణ మరియు ధ్రువీకరణ సెట్లుగా విభజిస్తుంది.

రకాలు: - k-మడత CV: డేటాను k మడతలుగా విభజించండి, k-1 లో శిక్షణ ఇవ్వండి, మిగిలిన వాటిని ధృవీకరించండి - లీవ్-వన్-అవుట్: k=n (ప్రతి నమూనా ధ్రువీకరణ ఒకసారి సెట్ చేయబడింది) - స్ట్రాటిఫైడ్ కె-ఫోల్డ్: ప్రతి మడతలో తరగతి పంపిణీని నిర్వహిస్తుంది

ప్రాముఖ్యం: - సింగిల్ ట్రైన్/టెస్ట్ స్ప్లిట్ కంటే మరింత నమ్మదగిన పనితీరు అంచనా - ఓవర్ ఫిట్టింగ్ ను గుర్తించడంలో సహాయపడుతుంది - పరిమిత డేటా వినియోగాన్ని పెంచుతుంది

నిర్దిష్ట అల్గారిథంలు

3. డెసిషన్ ట్రీ ఎలా పనిచేస్తుందో వివరించండి.

జవాబు: డెసిషన్ ట్రీలు సజాతీయమైన సమూహాలను సృష్టించడానికి ఫీచర్ విలువల ఆధారంగా డేటాను పునరావృతంగా విభజిస్తాయి.

కీలక భావనలు: - రూట్ నోడ్: అన్ని డేటాతో ప్రారంభ స్థానం - అంతర్గత నోడ్లు: ఫీచర్ పరిమితుల ఆధారంగా నిర్ణయ పాయింట్లు - ఆకు కణుపులు: తుది అంచనాలు (వర్గీకరణ) లేదా విలువలు (తిరోగమనం) - విభజన ప్రమాణాలు: గిని మలినాలు (వర్గీకరణ), వైవిధ్య తగ్గింపు (తిరోగమనం)

ప్రయోజనాలు: అర్థం చేసుకోదగినది, మిశ్రమ డేటా రకాలను హ్యాండిల్ చేస్తుంది, ఫీచర్ స్కేలింగ్ అవసరం లేదు ప్రతికూలతలు: ఓవర్ ఫిట్టింగ్ కు గురయ్యే అవకాశం ఉంది, చిన్న డేటా మార్పులతో అస్థిరంగా ఉంటుంది

4. బ్యాగింగ్ మరియు బూస్టింగ్ మధ్య తేడా ఏమిటి?

జవాబు: - బ్యాగింగ్ (బూట్ స్ట్రాప్ అగ్రిగేటింగ్): యాదృచ్ఛిక డేటా ఉపసెట్లపై బహుళ నమూనాలను సృష్టిస్తుంది, సగటు అంచనాలు. వైవిధ్యాన్ని తగ్గిస్తుంది, ఓవర్ ఫిట్టింగ్ తో పోరాడుతుంది. ఉదాహరణ: యాదృచ్ఛిక అడవి.

- బూస్టింగ్: మోడళ్లను వరుసగా నడుపుతుంది, ప్రతి ఒక్కటి మునుపటి తప్పులపై దృష్టి పెడుతుంది. పక్షపాతాన్ని తగ్గిస్తుంది, ఖచ్చితత్త్వాన్ని మెరుగుపరుస్తుంది. ఉదాహరణ: అడాబూస్ట్, XGBoost.

ముఖ్య తేడాలు: - బ్యాగింగ్: సమాంతరంగా, వైవిధ్యాన్ని తగ్గిస్తుంది - బూస్టింగ్: సీక్వెన్షియల్, పక్షపాతాన్ని తగ్గిస్తుంది - బ్యాగింగ్: స్వతంత్ర నమూనాలు - బూస్టింగ్: లోపాల నుండి నేర్చుకునే డిపెండెంట్ మోడల్స్

SQL ప్రశ్నలు

బేసిక్ SQL

1. ఉద్యోగి టేబుల్ నుంచి రెండో అత్యధిక వేతనం కనుగొనండి.

పరిష్కారాలు: '''SQL - పద్ధతి 1: సబ్ క్వైరీ గరిష్టం(జీతం)ని రెండో అత్యధిక వేతనం వలే ఎంచుకోండి ఉద్యోగి నుంచి వేతనం ఎక్కడ

డేటా సైన్స్ ఇంటర్వ్యూ ప్రశ్నలు: DS పాత్రల కోసం పూర్తి గైడ్ (2026) | కర్మ సఖ

Yaman Khetan

Helpful Resources

Explore Related Topics

Take Action on Your Career

Ready to Build Your Perfect Resume?