Failed to render content. Please refresh the page. Showing plain-text fallback.
"@/components/CTA" ನಿಂದ CTA ಆಮದು ಮಾಡಿ
ಡೇಟಾ ಸೈನ್ಸ್ ಸಂದರ್ಶನ ಪ್ರಶ್ನೆಗಳು: ಡಿಎಸ್ ಪಾತ್ರಗಳಿಗಾಗಿ ಸಂಪೂರ್ಣ ಮಾರ್ಗದರ್ಶಿ (2025)
ಕೊನೆಯದಾಗಿ ನವೀಕರಿಸಲಾಗಿದೆ: ಫೆಬ್ರವರಿ 7, 2025
ಪ್ರಮುಖ ಟೇಕ್ ಅವೇಗಳು
- ಡೇಟಾ ಸೈನ್ಸ್ ಸಂದರ್ಶನಗಳು ಅಂಕಿಅಂಶಗಳು, ಯಂತ್ರ ಕಲಿಕೆ, ಎಸ್ ಕ್ಯೂಎಲ್ ಮತ್ತು ವ್ಯವಹಾರ ಕುಶಲತೆಯನ್ನು ಒಳಗೊಂಡಿವೆ
- ಪರಿಕಲ್ಪನೆಗಳನ್ನು ಸರಳವಾಗಿ ವಿವರಿಸುವ ಮತ್ತು ನೈಜ-ಪ್ರಪಂಚದ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುವುದನ್ನು ಅಭ್ಯಾಸ ಮಾಡಿ
- ಮಾಸ್ಟರ್ ಎ / ಬಿ ಪರೀಕ್ಷೆ, ಪ್ರಾಯೋಗಿಕ ವಿನ್ಯಾಸ ಮತ್ತು ಸಾಂದರ್ಭಿಕ ತೀರ್ಮಾನ
- ತಾಂತ್ರಿಕ ಕೌಶಲ್ಯ ಮತ್ತು ವ್ಯವಹಾರದ ಪ್ರಭಾವ ಎರಡನ್ನೂ ಪ್ರದರ್ಶಿಸಿ
- ಕೇಸ್ ಸ್ಟಡೀಸ್ ಮತ್ತು ಪ್ರಾಡಕ್ಟ್ ಸೆನ್ಸ್ ಪ್ರಶ್ನೆಗಳಿಗೆ ತಯಾರಿ ಮಾಡಿ
🎯 ಪ್ರೊ ಸಲಹೆ: ಡೇಟಾ ಸೈನ್ಸ್ ಸಂದರ್ಶನಗಳು ಡೇಟಾದಿಂದ ಒಳನೋಟಗಳನ್ನು ಹೊರತೆಗೆಯುವ ಮತ್ತು ವ್ಯವಹಾರ ನಿರ್ಧಾರಗಳನ್ನು ಚಾಲನೆ ಮಾಡುವ ನಿಮ್ಮ ಸಾಮರ್ಥ್ಯವನ್ನು ನಿರ್ಣಯಿಸುತ್ತವೆ. ಸಂಕೀರ್ಣ ಪರಿಕಲ್ಪನೆಗಳನ್ನು ಸರಳವಾಗಿ ವಿವರಿಸುವತ್ತ ಗಮನ ಹರಿಸಿ, ವ್ಯವಹಾರ ಕುಶಲತೆಯನ್ನು ತೋರಿಸಿ ಮತ್ತು ಎಂಡ್-ಟು-ಎಂಡ್ ಸಮಸ್ಯೆ-ಪರಿಹರಿಸುವ ಕೌಶಲ್ಯಗಳನ್ನು ಪ್ರದರ್ಶಿಸಿ.
ಡೇಟಾ ಸೈನ್ಸ್ ಸಂದರ್ಶನ ರಚನೆ
ಡೇಟಾ ಸೈನ್ಸ್ ಸಂದರ್ಶನಗಳು ಸಾಮಾನ್ಯವಾಗಿ ವಿಭಿನ್ನ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ನಿರ್ಣಯಿಸುವ ಅನೇಕ ಸುತ್ತುಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ:
ಸಂದರ್ಶನ ಸುತ್ತುಗಳು:
- ಫೋನ್ ಸ್ಕ್ರೀನ್: ಮೂಲ ಎಸ್ ಕ್ಯೂಎಲ್, ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ನಡವಳಿಕೆಯ ಪ್ರಶ್ನೆಗಳು
- ತಾಂತ್ರಿಕ ಸಂದರ್ಶನ: ಕೋಡಿಂಗ್, ಅಂಕಿಅಂಶಗಳು, ಎಂಎಲ್ ಕ್ರಮಾವಳಿಗಳು
- ಕೇಸ್ ಸ್ಟಡಿ: ವ್ಯವಹಾರ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮತ್ತು ಪ್ರಸ್ತುತಿ
- ತಂಡ / ನಾಯಕತ್ವ: ಸಾಂಸ್ಕೃತಿಕ ಫಿಟ್ ಮತ್ತು ಸಹಯೋಗ ಮೌಲ್ಯಮಾಪನ
ಮೌಲ್ಯಮಾಪನ ಪ್ರದೇಶಗಳು:
- ತಾಂತ್ರಿಕ ಕೌಶಲ್ಯಗಳು: ಎಸ್ ಕ್ಯೂಎಲ್, ಪೈಥಾನ್ / ಆರ್, ಅಂಕಿಅಂಶಗಳು, ಯಂತ್ರ ಕಲಿಕೆ
- ಸಮಸ್ಯೆ-ಪರಿಹಾರ: ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಚಿಂತನೆ ಮತ್ತು ವಿಧಾನ
- ವ್ಯವಹಾರ ಕುಶಲತೆ: ವ್ಯವಹಾರದ ಪ್ರಭಾವ ಮತ್ತು ಆದ್ಯತೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
- ಸಂವಹನ: ತಾಂತ್ರಿಕೇತರ ಮಧ್ಯಸ್ಥಗಾರರಿಗೆ ತಾಂತ್ರಿಕ ಪರಿಕಲ್ಪನೆಗಳನ್ನು ವಿವರಿಸುವುದು
ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ಸಂಭವನೀಯತೆಯ ಪ್ರಶ್ನೆಗಳು
ಮೂಲ ಅಂಕಿಅಂಶಗಳು
1. ಟೈಪ್ I ಮತ್ತು ಟೈಪ್ II ದೋಷಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ವಿವರಿಸಿ.
ಉತ್ತರ:
- ಟೈಪ್ I ದೋಷ (ಸುಳ್ಳು ಧನಾತ್ಮಕ): ಶೂನ್ಯ ಊಹೆಯನ್ನು ಅದು ನಿಜವಾದಾಗ ತಿರಸ್ಕರಿಸುವುದು (α ದೋಷ)
- ಟೈಪ್ II ದೋಷ (ಸುಳ್ಳು ಋಣಾತ್ಮಕ): ಶೂನ್ಯ ಊಹೆಯು ಸುಳ್ಳಾಗಿದ್ದಾಗ ಅದನ್ನು ತಿರಸ್ಕರಿಸಲು ವಿಫಲವಾಗುವುದು (β ದೋಷ)
ಉದಾಹರಣೆ: ಸ್ಪ್ಯಾಮ್ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯಲ್ಲಿ:
- ಟೈಪ್ I: ಕಾನೂನುಬದ್ಧ ಇಮೇಲ್ ಅನ್ನು ಸ್ಪ್ಯಾಮ್ ಎಂದು ಗುರುತಿಸುವುದು
- ಟೈಪ್ II: ಕಾಣೆಯಾದ ಸ್ಪ್ಯಾಮ್ ಇಮೇಲ್ (ಅದನ್ನು ಬಿಡುವುದು)
ಶಕ್ತಿ = 1 - β (ಸುಳ್ಳು ಶೂನ್ಯ ಊಹೆಯನ್ನು ಸರಿಯಾಗಿ ತಿರಸ್ಕರಿಸುವ ಸಂಭವನೀಯತೆ)
2. ಪಿ-ಮೌಲ್ಯ ಎಂದರೇನು ಮತ್ತು ನೀವು ಅದನ್ನು ಹೇಗೆ ವ್ಯಾಖ್ಯಾನಿಸುತ್ತೀರಿ?
ಉತ್ತರ:
ಪಿ-ಮೌಲ್ಯವು ಶೂನ್ಯ ಊಹೆ ನಿಜವೆಂದು ಭಾವಿಸಿ, ಗಮನಿಸಿದ ಡೇಟಾದಷ್ಟು (ಅಥವಾ ಹೆಚ್ಚು ತೀವ್ರವಾದ) ಡೇಟಾವನ್ನು ಗಮನಿಸುವ ಸಂಭವನೀಯತೆಯಾಗಿದೆ.
ವ್ಯಾಖ್ಯಾನ:
- ಪು 10 ಮಲ್ಟಿಕೊಲಿನಿಯರಿಟಿಯನ್ನು ಸೂಚಿಸುತ್ತದೆ
- ಸಾಮಾನ್ಯತೆಗಾಗಿ ಕ್ಯೂ-ಕ್ಯೂ ಪ್ಲಾಟ್ ಗಳು
ಯಂತ್ರ ಕಲಿಕೆ ಪ್ರಶ್ನೆಗಳು
ಎಂಎಲ್ ಫಂಡಮೆಂಟಲ್ಸ್
1. ಪಕ್ಷಪಾತ-ವ್ಯತ್ಯಾಸದ ವ್ಯಾಪಾರವನ್ನು ವಿವರಿಸಿ.
ಉತ್ತರ:
- ಪಕ್ಷಪಾತ: ಊಹೆಗಳನ್ನು ಸರಳೀಕರಿಸುವುದರಿಂದ ದೋಷ (ಅಂಡರ್ ಫಿಟಿಂಗ್)
- ವ್ಯತ್ಯಾಸ: ತರಬೇತಿ ಡೇಟಾಕ್ಕೆ ಸೂಕ್ಷ್ಮತೆಯಿಂದ ದೋಷ (ಓವರ್ ಫಿಟ್ಟಿಂಗ್ )
- ಟ್ರೇಡ್ ಆಫ್: ಕಡಿಮೆ ಪಕ್ಷಪಾತವನ್ನು ಹೊಂದಿರುವ ಮಾದರಿಗಳು ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಹೊಂದಿರುತ್ತವೆ, ಮತ್ತು ಇದಕ್ಕೆ ವಿರುದ್ಧವಾಗಿ
ಉದಾಹರಣೆಗಳು:
- ಹೆಚ್ಚಿನ ಪಕ್ಷಪಾತ: ರೇಖಾತ್ಮಕವಲ್ಲದ ಡೇಟಾದಲ್ಲಿ ರೇಖೀಯ ಹಿಮ್ಮುಖತೆ
- ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ: ಓವರ್ ಫಿಟ್ಟಿಂಗ್ ನಿರ್ಧಾರ ಮರ
ಪರಿಹಾರಗಳು:
- ಎರಡನ್ನೂ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಅಡ್ಡ-ಮೌಲ್ಯೀಕರಣ
- ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಕ್ರಮಬದ್ಧಗೊಳಿಸುವಿಕೆ (L1 / L2)
- ಎರಡನ್ನೂ ಕಡಿಮೆ ಮಾಡಲು ಸಮೂಹ ವಿಧಾನಗಳು
2. ಅಡ್ಡ-ಮೌಲ್ಯೀಕರಣ ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಮುಖ್ಯ?
ಉತ್ತರ:
ಕ್ರಾಸ್-ವ್ಯಾಲಿಡೇಶನ್ ಮಾದರಿ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನಿರ್ಣಯಿಸಲು ಮತ್ತು ಓವರ್ ಫಿಟ್ಟಿಂಗ್ ಅನ್ನು ತಡೆಗಟ್ಟಲು ತರಬೇತಿ ಮತ್ತು ಮೌಲ್ಯೀಕರಣ ಸೆಟ್ ಗಳನ್ನು ಅನೇಕ ಬಾರಿ ವಿಭಜಿಸುತ್ತದೆ.
ವಿಧಗಳು:
- k-ಮಡಚುವ ಸಿವಿ: ಡೇಟಾವನ್ನು k ಮಡಿಕೆಗಳಾಗಿ ವಿಭಜಿಸಿ, ಕೆ -1 ನಲ್ಲಿ ತರಬೇತಿ, ಉಳಿದ ಮೇಲೆ ಮೌಲ್ಯೀಕರಿಸಿ
- ಲೀವ್-ಒನ್-ಔಟ್: k=n (ಪ್ರತಿ ಮಾದರಿಯನ್ನು ಒಮ್ಮೆ ಮೌಲ್ಯೀಕರಣಗೊಳಿಸಲಾಗುತ್ತದೆ)
- ಶ್ರೇಣೀಕೃತ ಕೆ-ಫೋಲ್ಡ್: ಪ್ರತಿ ಮಡಿಕೆಯಲ್ಲಿ ವರ್ಗ ವಿತರಣೆಯನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ
ಪ್ರಾಮುಖ್ಯತೆ:
- ಏಕ ರೈಲು / ಪರೀಕ್ಷಾ ವಿಭಜನೆಗಿಂತ ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹ ಕಾರ್ಯಕ್ಷಮತೆಯ ಅಂದಾಜು
- ಓವರ್ ಫಿಟ್ಟಿಂಗ್ ಅನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ
- ಸೀಮಿತ ಡೇಟಾದ ಬಳಕೆಯನ್ನು ಗರಿಷ್ಠಗೊಳಿಸುತ್ತದೆ
ನಿರ್ದಿಷ್ಟ ಕ್ರಮಾವಳಿಗಳು
3. ನಿರ್ಧಾರ ವೃಕ್ಷವು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ವಿವರಿಸಿ.
ಉತ್ತರ:
ಏಕರೂಪದ ಗುಂಪುಗಳನ್ನು ರಚಿಸಲು ನಿರ್ಧಾರ ಮರಗಳು ವೈಶಿಷ್ಟ್ಯ ಮೌಲ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾವನ್ನು ಪುನರಾವರ್ತಿತವಾಗಿ ವಿಭಜಿಸುತ್ತವೆ.
ಪ್ರಮುಖ ಪರಿಕಲ್ಪನೆಗಳು:
- ರೂಟ್ ನೋಡ್: ಎಲ್ಲಾ ಡೇಟಾದೊಂದಿಗೆ ಆರಂಭಿಕ ಹಂತ
- ಆಂತರಿಕ ನೋಡ್ ಗಳು: ವೈಶಿಷ್ಟ್ಯದ ಮಿತಿಗಳನ್ನು ಆಧರಿಸಿದ ನಿರ್ಧಾರ ಬಿಂದುಗಳು
- ಎಲೆ ನೋಡ್ ಗಳು: ಅಂತಿಮ ಮುನ್ಸೂಚನೆಗಳು (ವರ್ಗೀಕರಣ) ಅಥವಾ ಮೌಲ್ಯಗಳು (ಹಿಮ್ಮೆಟ್ಟುವಿಕೆ)
- ವಿಭಜನೆಯ ಮಾನದಂಡ: ಗಿನಿ ಕಲ್ಮಶ (ವರ್ಗೀಕರಣ), ವ್ಯತ್ಯಾಸ ಕಡಿತ (ಹಿಮ್ಮೆಟ್ಟುವಿಕೆ)
ಪ್ರಯೋಜನಗಳು: ವ್ಯಾಖ್ಯಾನಿಸಬಹುದಾದ, ಮಿಶ್ರ ಡೇಟಾ ಪ್ರಕಾರಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ, ಯಾವುದೇ ವೈಶಿಷ್ಟ್ಯ ಸ್ಕೇಲಿಂಗ್ ಅಗತ್ಯವಿಲ್ಲ
ಅನಾನುಕೂಲಗಳು: ಸಣ್ಣ ಡೇಟಾ ಬದಲಾವಣೆಗಳೊಂದಿಗೆ ಓವರ್ ಫಿಟ್ಟಿಂಗ್ ಗೆ ಗುರಿಯಾಗುತ್ತದೆ, ಅಸ್ಥಿರವಾಗಿದೆ
4. ಬ್ಯಾಗಿಂಗ್ ಮತ್ತು ಬೂಸ್ಟಿಂಗ್ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು?
ಉತ್ತರ:
- ಬ್ಯಾಗಿಂಗ್ (ಬೂಟ್ ಸ್ಟ್ರಾಪ್ ಅಗ್ರಿಗೇಟಿಂಗ್): ಯಾದೃಚ್ಛಿಕ ಡೇಟಾ ಉಪವಿಭಾಗಗಳಲ್ಲಿ ಅನೇಕ ಮಾದರಿಗಳನ್ನು ರಚಿಸುತ್ತದೆ, ಸರಾಸರಿ ಊಹೆಗಳನ್ನು ಮಾಡುತ್ತದೆ. ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ, ಅತಿಯಾದ ಫಿಟ್ಟಿಂಗ್ ವಿರುದ್ಧ ಹೋರಾಡುತ್ತದೆ. ಉದಾಹರಣೆ: ಯಾದೃಚ್ಛಿಕ ಅರಣ್ಯ.
- ಬೂಸ್ಟಿಂಗ್: ಮಾದರಿಗಳನ್ನು ಅನುಕ್ರಮವಾಗಿ ರೈಲು ಮಾಡುತ್ತದೆ, ಪ್ರತಿಯೊಂದೂ ಹಿಂದಿನ ತಪ್ಪುಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. ಪಕ್ಷಪಾತವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ, ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ. ಉದಾಹರಣೆ: ಅಡಾಬೂಸ್ಟ್, ಎಕ್ಸ್ ಜಿಬೂಸ್ಟ್.
ಪ್ರಮುಖ ವ್ಯತ್ಯಾಸಗಳು:
- ಬ್ಯಾಗಿಂಗ್: ಸಮಾನಾಂತರ, ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ
- ವರ್ಧಕ: ಅನುಕ್ರಮ, ಪಕ್ಷಪಾತವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ
- ಬ್ಯಾಗಿಂಗ್: ಸ್ವತಂತ್ರ ಮಾದರಿಗಳು
- ಬೂಸ್ಟಿಂಗ್: ಅವಲಂಬಿತ ಮಾದರಿಗಳು ದೋಷಗಳಿಂದ ಕಲಿಯುತ್ತವೆ
SQL ಪ್ರಶ್ನೆಗಳು
ಮೂಲ SQL
1. ಉದ್ಯೋಗಿ ಟೇಬಲ್ ನಿಂದ ಎರಡನೇ ಅತಿ ಹೆಚ್ಚು ಸಂಬಳವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ.
ಪರಿಹಾರಗಳು:
'''SQL
- ವಿಧಾನ 1: ಸಬ್ಕ್ವೆರಿ
ಗರಿಷ್ಟ (ಸಂಬಳ) ಅನ್ನು ಎರಡನೆಯದುಅತ್ಯಧಿಕ ಸಂಬಳವಾಗಿ ಆಯ್ಕೆ ಮಾಡಿ
ಉದ್ಯೋಗಿಯಿಂದ
ಎಲ್ಲಿ ಸಂಬಳ