Failed to render content. Please refresh the page. Showing plain-text fallback.
"@/కాంపోనెంట్స్/CTA" నుంచి CTA ని ఇంపోర్ట్ చేసుకోండి
డేటా సైన్స్ ఇంటర్వ్యూ ప్రశ్నలు: DS పాత్రల కోసం పూర్తి గైడ్ (2025)
చివరిగా నవీకరించబడింది: ఫిబ్రవరి 7, 2025
కీ టేక్ అవేస్
- డేటా సైన్స్ ఇంటర్వ్యూలు స్టాటిస్టిక్స్, మెషిన్ లెర్నింగ్, SQL మరియు వ్యాపార చతురతను కవర్ చేస్తాయి
- భావనలను సరళంగా వివరించడం మరియు వాస్తవ ప్రపంచ సమస్యలను పరిష్కరించడం ప్రాక్టీస్ చేయడం
- మాస్టర్ ఎ / బి టెస్టింగ్, ప్రయోగాత్మక రూపకల్పన మరియు కారణ నిర్ధారణ
- సాంకేతిక నైపుణ్యాలు మరియు వ్యాపార ప్రభావం రెండింటిని ప్రదర్శించడం
- కేస్ స్టడీస్ మరియు ప్రొడక్ట్ సెన్స్ ప్రశ్నల కొరకు సిద్ధం చేయడం
🎯 ప్రో చిట్కా: డేటా సైన్స్ ఇంటర్వ్యూలు డేటా నుండి అంతర్దృష్టులను సేకరించడానికి మరియు వ్యాపార నిర్ణయాలను నడపడానికి మీ సామర్థ్యాన్ని అంచనా వేస్తాయి. సంక్లిష్టమైన భావనలను సరళంగా వివరించడం, వ్యాపార చతురతను చూపించడం మరియు ఎండ్-టు-ఎండ్ సమస్య పరిష్కార నైపుణ్యాలను ప్రదర్శించడంపై దృష్టి పెట్టండి.
డేటా సైన్స్ ఇంటర్వ్యూ స్ట్రక్చర్
డేటా సైన్స్ ఇంటర్వ్యూలు సాధారణంగా వివిధ సామర్థ్యాలను అంచనా వేసే బహుళ రౌండ్లను కలిగి ఉంటాయి:
ఇంటర్వ్యూ రౌండ్లు:
- ఫోన్ స్క్రీన్: ప్రాథమిక SQL, గణాంకాలు మరియు ప్రవర్తనా ప్రశ్నలు
- టెక్నికల్ ఇంటర్వ్యూ: కోడింగ్, స్టాటిస్టిక్స్, ML అల్గోరిథంలు
- కేస్ స్టడీ: వ్యాపార సమస్య పరిష్కారం మరియు ప్రదర్శన
- జట్టు / నాయకత్వం: సాంస్కృతిక ఫిట్ మరియు సహకార అంచనా
మూల్యాంకన ప్రాంతాలు:
- సాంకేతిక నైపుణ్యాలు: SQL, పైథాన్ / R, గణాంకాలు, మెషిన్ లెర్నింగ్
- సమస్య పరిష్కారం: విశ్లేషణాత్మక ఆలోచన మరియు పద్దతి
- వ్యాపార చతురత: వ్యాపార ప్రభావం మరియు ప్రాధాన్యతలను అర్థం చేసుకోవడం
- కమ్యూనికేషన్: సాంకేతికేతర వాటాదారులకు సాంకేతిక భావనలను వివరించడం
గణాంకాలు & సంభావ్యత ప్రశ్నలు
ప్రాథమిక గణాంకాలు
1. టైప్ I మరియు టైప్ II దోషాల మధ్య తేడాను వివరించండి.
జవాబు:
- టైప్ I లోపం (తప్పుడు పాజిటివ్): శూన్య పరికల్పన నిజం అయినప్పుడు తిరస్కరించడం (α లోపం)
- టైప్ II లోపం (తప్పుడు ప్రతికూలత): శూన్య పరికల్పన తప్పు అయినప్పుడు తిరస్కరించడంలో విఫలం కావడం (β లోపం)
ఉదాహరణ: స్పామ్ గుర్తింపులో:
- టైప్ I: చట్టబద్ధమైన ఇమెయిల్ ను స్పామ్ గా గుర్తించడం
- టైప్ II: తప్పిపోయిన స్పామ్ ఇమెయిల్ (దానిని అనుమతించడం)
పవర్ = 1 - β (తప్పుడు శూన్య పరికల్పనను సరిగ్గా తిరస్కరించే సంభావ్యత)
2. p-విలువ అంటే ఏమిటి మరియు మీరు దానిని ఎలా అర్థం చేసుకుంటారు?
జవాబు:
P-విలువ అనేది గమనించిన డేటా వలె విపరీతమైన (లేదా మరింత తీవ్రమైన) డేటాను గమనించే సంభావ్యత, శూన్య పరికల్పన నిజమని భావించడం.
వ్యాఖ్యానం:
- p 10 మల్టీకోలినెరిటీని సూచిస్తుంది
- సాధారణత కోసం Q-Q ప్లాట్లు
మెషిన్ లెర్నింగ్ ప్రశ్నలు
ML ఫండమెంటల్స్
1. బయాస్-వేరియన్స్ ట్రేడ్ ఆఫ్ గురించి వివరించండి.
జవాబు:
- పక్షపాతం: ఊహాగానాలను సరళీకృతం చేయడంలో లోపం (అండర్ ఫిట్టింగ్)
- వైవిధ్యం: శిక్షణా డేటాకు సున్నితత్వం నుండి లోపం (ఓవర్ ఫిట్టింగ్)
- ట్రేడ్ ఆఫ్: తక్కువ పక్షపాతం ఉన్న నమూనాలు అధిక వ్యత్యాసాన్ని కలిగి ఉంటాయి, మరియు దీనికి విరుద్ధంగా ఉంటాయి
ఉదాహరణలు:
- అధిక పక్షపాతం: నాన్-లీనియర్ డేటాపై లీనియర్ రిగ్రెషన్
- అధిక వ్యత్యాసం: ఓవర్ ఫిట్టింగ్ డెసిషన్ ట్రీ
పరిష్కారాలు:
రెండింటినీ అంచనా వేయడానికి క్రాస్-ధ్రువీకరణ
- వైవిధ్యాన్ని తగ్గించడానికి క్రమబద్ధీకరణ (L1 / L2)
రెండింటినీ తగ్గించడానికి సమిష్టి పద్ధతులు
2. క్రాస్ వాలిడేషన్ అంటే ఏమిటి మరియు ఇది ఎందుకు ముఖ్యమైనది?
జవాబు:
క్రాస్-ధ్రువీకరణ మోడల్ పనితీరును అంచనా వేయడానికి మరియు ఓవర్ ఫిట్టింగ్ ను నివారించడానికి డేటాను శిక్షణ మరియు ధ్రువీకరణ సెట్లుగా విభజిస్తుంది.
రకాలు:
- k-మడత CV: డేటాను k మడతలుగా విభజించండి, k-1 లో శిక్షణ ఇవ్వండి, మిగిలిన వాటిని ధృవీకరించండి
- లీవ్-వన్-అవుట్: k=n (ప్రతి నమూనా ధ్రువీకరణ ఒకసారి సెట్ చేయబడింది)
- స్ట్రాటిఫైడ్ కె-ఫోల్డ్: ప్రతి మడతలో తరగతి పంపిణీని నిర్వహిస్తుంది
ప్రాముఖ్యం:
- సింగిల్ ట్రైన్/టెస్ట్ స్ప్లిట్ కంటే మరింత నమ్మదగిన పనితీరు అంచనా
- ఓవర్ ఫిట్టింగ్ ను గుర్తించడంలో సహాయపడుతుంది
- పరిమిత డేటా వినియోగాన్ని పెంచుతుంది
నిర్దిష్ట అల్గారిథంలు
3. డెసిషన్ ట్రీ ఎలా పనిచేస్తుందో వివరించండి.
జవాబు:
డెసిషన్ ట్రీలు సజాతీయమైన సమూహాలను సృష్టించడానికి ఫీచర్ విలువల ఆధారంగా డేటాను పునరావృతంగా విభజిస్తాయి.
కీలక భావనలు:
- రూట్ నోడ్: అన్ని డేటాతో ప్రారంభ స్థానం
- అంతర్గత నోడ్లు: ఫీచర్ పరిమితుల ఆధారంగా నిర్ణయ పాయింట్లు
- ఆకు కణుపులు: తుది అంచనాలు (వర్గీకరణ) లేదా విలువలు (తిరోగమనం)
- విభజన ప్రమాణాలు: గిని మలినాలు (వర్గీకరణ), వైవిధ్య తగ్గింపు (తిరోగమనం)
ప్రయోజనాలు: అర్థం చేసుకోదగినది, మిశ్రమ డేటా రకాలను హ్యాండిల్ చేస్తుంది, ఫీచర్ స్కేలింగ్ అవసరం లేదు
ప్రతికూలతలు: ఓవర్ ఫిట్టింగ్ కు గురయ్యే అవకాశం ఉంది, చిన్న డేటా మార్పులతో అస్థిరంగా ఉంటుంది
4. బ్యాగింగ్ మరియు బూస్టింగ్ మధ్య తేడా ఏమిటి?
జవాబు:
- బ్యాగింగ్ (బూట్ స్ట్రాప్ అగ్రిగేటింగ్): యాదృచ్ఛిక డేటా ఉపసెట్లపై బహుళ నమూనాలను సృష్టిస్తుంది, సగటు అంచనాలు. వైవిధ్యాన్ని తగ్గిస్తుంది, ఓవర్ ఫిట్టింగ్ తో పోరాడుతుంది. ఉదాహరణ: యాదృచ్ఛిక అడవి.
- బూస్టింగ్: మోడళ్లను వరుసగా నడుపుతుంది, ప్రతి ఒక్కటి మునుపటి తప్పులపై దృష్టి పెడుతుంది. పక్షపాతాన్ని తగ్గిస్తుంది, ఖచ్చితత్త్వాన్ని మెరుగుపరుస్తుంది. ఉదాహరణ: అడాబూస్ట్, XGBoost.
ముఖ్య తేడాలు:
- బ్యాగింగ్: సమాంతరంగా, వైవిధ్యాన్ని తగ్గిస్తుంది
- బూస్టింగ్: సీక్వెన్షియల్, పక్షపాతాన్ని తగ్గిస్తుంది
- బ్యాగింగ్: స్వతంత్ర నమూనాలు
- బూస్టింగ్: లోపాల నుండి నేర్చుకునే డిపెండెంట్ మోడల్స్
SQL ప్రశ్నలు
బేసిక్ SQL
1. ఉద్యోగి టేబుల్ నుంచి రెండో అత్యధిక వేతనం కనుగొనండి.
పరిష్కారాలు:
'''SQL
- పద్ధతి 1: సబ్ క్వైరీ
గరిష్టం(జీతం)ని రెండో అత్యధిక వేతనం వలే ఎంచుకోండి
ఉద్యోగి నుంచి
వేతనం ఎక్కడ