NSCT-Data Collection & Pre-processing MCQs

1. . Data collection in analytics is:

(A) Backup only

(B) Encrypting data only

(D) The process of gathering relevant and accurate data from various sources

2. . Primary data sources include:

(A) Data warehouses only

(B) Databases only

(D) Backup only

3. . Secondary data sources include:

(A) Experiments only

(B) Personal interviews only

(D) Backup only

4. . Data pre-processing is important because:

(A) Encrypting data

(B) Raw data often contains noise, missing values, and inconsistencies

(D) Backup only

5. . Data cleaning involves:

(A) Backup only

(B) Encrypting data

(D) Removing duplicates, correcting errors, and handling missing values

6. . Data normalization is:

(A) Compressing values

(B) Encrypting numbers

(D) Backup only

7. . Data transformation includes:

(A) Backup only

(B) Encrypting transformations

(D) Converting data formats, encoding categorical variables, and aggregating values

8. . Handling missing values can be done by:

(A) Backup only

(B) Encrypting missing values

(D) Removing rows, filling with mean/median/mode, or using predictive imputation

9. . Outlier detection in pre-processing helps to:

(A) Backup only

(B) Encrypt outliers

(D) Identify and handle data points that deviate significantly from the rest

10. . Feature selection is:

(A) Encrypting features

(B) Choosing relevant variables to reduce dimensionality and improve model accuracy

(D) Backup only

11. . Feature extraction is:

(A) Backup only

(B) Encrypting features

(D) Creating new features from existing data to better represent patterns

12. . Data integration involves:

(A) Encrypting integration

(B) Combining data from multiple sources into a unified dataset

(D) Backup only

13. . Data reduction techniques include:

(A) Dimensionality reduction, sampling, and aggregation

(B) Encrypting data

(D) Backup only

14. . One-hot encoding is used to:

(A) Compress categories

(B) Encrypt categories

(D) Backup only

15. . Z-score standardization is:

(A) Scaling data based on mean and standard deviation

(B) Encrypting z-scores

(D) Backup only

16. . Data discretization is:

(A) Converting continuous data into intervals or categories

(B) Encrypting intervals

(D) Backup only

17. . Noise in data refers to:

(A) Compressing noise

(B) Encrypting errors

(D) Backup only

18. . Data pre-processing improves:

(A) Encrypting models

(B) Accuracy, efficiency, and performance of AI and ML models

(D) Backup only

19. . Sampling in data pre-processing is used to:

(A) Backup only

(B) Encrypt samples

(D) Reduce dataset size while maintaining representative information

20. . The main purpose of data collection and pre-processing is to:

(A) Compress files only

(B) Encrypt data only

(D) Backup only