Download Original PDF
Get the official Barkatullah University print version scanned document.
ЁЯдЭ Help Your Juniors!
Have previous year question papers that aren't on our website? Help the next batch of students by sending them to us! With your consent, we will proudly feature your name as a Top Contributor on our platform.
Submit Papers ЁЯУйTotal No. of Questions: 11
Total No. of Printed Pages: 15
ST-451
M.Sc. (New/ATKT) Examination, 2025
(Fourth Semester)
COMPUTER SCIENCE
MSCS-401
Big Data Analytics
Time : 3 Hours
Maximum Marks : 85
рдиреЛрдЯ : рд╕рднреА рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рдЙрддреНрддрд░ рджреАрдЬрд┐рдП ред
Attempt all the questions.
-
рд╕рд╣реА рдЙрддреНрддрд░ рдХрд╛ рдЪрдпрди рдХреАрдЬрд┐рдП :
Choose the correct answer :
рдиреЛрдЯ : рд╕рднреА рддреАрдиреЛрдВ рдЦрдгреНрдбреЛрдВ рд╕реЗ рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рдирд┐рд░реНрджреЗрд╢рд╛рдиреБрд╕рд╛рд░ рдЙрддреНрддрд░ рджреАрдЬрд┐рдП ред
рдЕрдВрдХреЛрдВ рдХрд╛ рд╡рд┐рднрд╛рдЬрди рдЦрдгреНрдбреЛрдВ рдХреЗ рд╕рд╛рде рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ ред
Attempt questions of all three Sections as directed.
Distribution of marks is given with the Sections.
рдЦрдгреНрдб 'рдЕ'
Section A
(рд╡рд╕реНрддреБрдирд┐рд╖реНрда рдкреНрд░рд╢реНрди)
(Objective Type Questions)
1.5├Ч10=15
(i)
рдбреЗрдЯрд╛ ___________________ рдмрд╛рдЗрдЯреНрд╕ рдЖрдХрд╛рд░ рдХрд╛ рд╣реЛрддрд╛ рд╣реИ рдЬрд┐рд╕реЗ рдмрд┐рдЧ рдбреЗрдЯрд╛ рдХрд╣рддреЗ рд╣реИрдВ ред
Data in....................bytes size is called Big data.
(рдЕ) рдЯреЗрд░рд╛
(a) Tera
(рдм) рдЧреАрдЧрд╛
(b) Giga
(рд╕) рдкреЗрдЯрд╛
(c) Peta
(рдж) рдореЗрдЯрд╛
(d) Meta
(ii)
рдмрд┐рдЧ рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдПрдХ рдХреЛ рдЫреЛрдбрд╝рдХрд░ рдмрд╛рдХреА рд╕рднреА рдХрд░рддрд╛ рд╣реИ :
Big data analysis does the following except :
(рдЕ) рдбреЗрдЯрд╛ рдПрдХрддреНрд░ рдХрд░рддрд╛ рд╣реИ
(a) Collects data
(рдм) рдбреЗрдЯрд╛ рдлреИрд▓рд╛рддрд╛ рд╣реИ
(b) Spreads data
(рд╕) рдбреЗрдЯрд╛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рддрд╛ рд╣реИ
(c) Organizes data
(рдж) рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рддрд╛ рд╣реИ
(d) Analyzes data
(iii)
рдмрд┐рдЧ рдбреЗрдЯрд╛ рдХреА рд╡рд┐рд╢реЗрд╖рддрд╛ рдЬреЛ рд╕рдВрдЧреНрд░рд╣реАрдд рдбреЗрдЯрд╛ рдХреА рдЧреБрдгрд╡рддреНрддрд╛ рдХреЛ рд╕рдВрджрд░реНрднрд┐рдд рдХрд░рддреА рд╣реИ рд╡рд╣ рд╣реИ-------------ред
The feature of big data that refers to the quality of the stored data is...................
(рдЕ) рд╡рд┐рд╡рд┐рдзрддрд╛
(a) Variety
(рдм) рдЖрдпрддрди
(b) Volume
(рд╕) рд╕рддреНрдпрддрд╛
(c) Veracity
(рдж) рдкрд░рд┐рд╡рд░реНрддрдирд╢реАрд▓рддрд╛
(d) Variability
(iv)
...................рд╕реНрд▓реЗрд╡/рд╡рд░реНрдХрд░ рдиреЛрдб рд╣реИ рдФрд░ рдбреЗрдЯрд╛ рдмреНрд▓реЙрдХ рдХреЗ рд░реВрдк рдореЗрдВ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдбреЗрдЯрд╛ рд░рдЦрддрд╛ рд╣реИ ред
....................is the slave/worker node and holds the user data in the form of Data Blocks.
(рдЕ) рдбреЗрдЯрд╛ рдиреЛрдб
(a) Data Node
(рдм) рдиреЗрдо рдиреЛрдб
(b) Name Node
(рд╕) рдбреЗрдЯрд╛ рдмреНрд▓реЙрдХ
(c) Data Block
(рдж) рдкреНрд░рддрд┐рдХреГрддрд┐
(d) Replication
(v)
рдЕрдкрд╛рдЪреЗ рд╣рдбреВрдк---------------------рдмрд╛рдЗрдирд░реА рдХреБрдВрдЬреА рдорд╛рди рдпреБрдЧреНрдо рдХреЗ рд▓рд┐рдП рдПрдХ рд╕реНрдерд╛рдпреА рдбреЗрдЯрд╛ рд╕рдВрд░рдЪрдирд╛ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ ред
Apache Hadoop...................provides a persistent data structure for binary key value pairs.
(рдЕ) рдЧреЗрдЯрдлрд╛рдЗрд▓
(a) GetFile
(рдм) рд╕реАрдХреНрд╡реЗрдВрд╕ рдлрд╛рдЗрд▓
(b) Sequence File
(рд╕) рдкреБрдЯрдлрд╛рдЗрд▓
(c) PutFile
(рдж) рдЙрдкрд░реНрдпреБрдХреНрдд рд╕рднреА
(d) All of the above
(vi)
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рд╕реЗ рдХреМрди NoSQL рдбреЗрдЯрд╛рдмреЗрд╕ рдирд╣реАрдВ рд╣реИ ?
Which of the following is not a NoSQL database ?
(рдЕ) SQL рд╕рд░реНрд╡рд░
(a) SQL Server
(рдм) рдореЛрд░реНрдЧреЛ DD
(b) Mongo DD
(рд╕) рдХреИрд╕рдВрдбреНрд░рд╛
(c) Cassandra
(рдж) рдЙрдкрд░реНрдпреБрдХреНрдд рдореЗрдВ рд╕реЗ рдХреЛрдИ рдирд╣реАрдВ
(d) None of the above
(vii)
рд╕реНрдкрд╛рд░реНрдХ рдХреЗ рд▓рд┐рдП рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рд╕реЗ рдХреМрдирд╕реА рд╕рдорд░реНрдерд┐рдд рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рднрд╛рд╖рд╛ рд╣реИ ?
Which of the following is a supported programming language for Spark ?
(рдЕ) рдкрд╛рдпрдерди
(a) Python
(рдм) рдЬрд╛рд╡рд╛
(b) Java
(рд╕) рд╕реНрдХрд╛рд▓рд╛
(c) Scala
(рдж) рдЙрдкрд░реНрдпреБрдХреНрдд рд╕рднреА
(d) All of the above
(viii)
рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ--------------рдХрд╛ рдПрдХ рдЙрдкрд╕рдореВрд╣ рд╣реИ ред
Machine learning is a subset of ..............................
(рдЕ) рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ
(a) Deep learning
(рдм) рдбреЗрдЯрд╛ рд▓рд░реНрдирд┐рдВрдЧ
(b) Data learning
(рд╕) рдЖрд░реНрдЯрд┐рдлрд┐рд╢рд┐рдпрд▓ рдЗрдВрдЯреЗрд▓рд┐рдЬреЗрдВрд╕
(c) Artificial Intelligence
(рдж) рдЙрдкрд░реНрдпреБрдХреНрдд рдореЗрдВ рд╕реЗ рдХреЛрдИ рдирд╣реАрдВ
(d) None of the above
(ix)
R рдПрдХ--------------рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рднрд╛рд╖рд╛ рд╣реИ ред
R is a/an..................programming language.
(рдЕ) рдмрдВрдж рд╕реНрд░реЛрдд
(a) Closed source
(рдм) GPL
(b) GPL
(рд╕) рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд
(c) Open source
(рдж) рдирд┐рд╢реНрдЪрд┐рдд рд╕реНрд░реЛрдд
(d) Definite Source
(x)
рдирд┐рдореНрди рдореЗрдВ рд╕реЗ рдмрд┐рдЧ рдбреЗрдЯрд╛ рдХреА рдкреНрд░рд╛рдердорд┐рдХ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЛ рдЪреБрдирд┐рдП :
Choose the primary characteristics of big data among the following :
(рдЕ) рдореВрд▓реНрдп
(a) Value
(рдм) рд╡рд┐рд╡рд┐рдзрддрд╛
(b) Variety
(рд╕) рдЖрдпрддрди
(c) Volume
(рдж) рдЙрдкрд░реНрдпреБрдХреНрдд рд╕рднреА
(d) All of the above
рдЦрдгреНрдб 'рдм'
Section B
(рд▓рдШреБ рдЙрддреНрддрд░реАрдп рдкреНрд░рд╢реНрди)
(Short Answer Type Questions)
5├Ч5=25
рдиреЛрдЯ : рд╕рднреА рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рдЙрддреНрддрд░ рджреАрдЬрд┐рдП ред рдкреНрд░рддреНрдпреЗрдХ рдкреНрд░рд╢реНрди рдХреЗ рдЕрдВрдХ рд╕рдорд╛рди рд╣реИрдВ ред
Attempt all questions. Each question carries equal marks.
2.
рдмрд┐рдЧ рдбреЗрдЯрд╛ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд▓рд┐рдЦрд┐рдП ред
Write big data applications.
рдЕрдерд╡рд╛ (Or)
рд╡рд┐рддрд░рд┐рдд рдлрд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдо рдкрд░ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЯрд┐рдкреНрдкрдгреА рд▓рд┐рдЦрд┐рдП ред
Write a short note on distributed file system.
3.
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рд╕реЗ рдХрд┐рд╕реА рдПрдХ рдкрд░ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЯрд┐рдкреНрдкрдгреА рд▓рд┐рдЦрд┐рдП :
Write short note on the following (any one) :
(рдЕ) рдореИрдкрд░рд┐рдбреНрдпреВрд╕ рдХреЗ рдЗрдирдкреБрдЯ рдФрд░ рдЖрдЙрдЯрдкреБрдЯ рдХреЛ рд╕рдордЭрдирд╛
(a) Understanding inputs and outputs of Map-Reduce
(рдм) Hadoop рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рдЕрдВрджрд░ рдФрд░ рдмрд╛рд╣рд░ рд▓реЗ рдЬрд╛рдирд╛ ред
(b) Moving data in and out of Hadoop.
4.
Hbase рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдЗрд╕рдХреЗ рдЙрдиреНрдирдд рдЙрдкрдпреЛрдЧ рдХреЛ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреАрдЬрд┐рдП ред
Explain Hbase concept and its advanced usage.
рдЕрдерд╡рд╛ (Or)
Zookeeper рдХреНрдпрд╛ рд╣реИ ? рдпрд╣ рдХреНрд▓рд╕реНрдЯрд░ рдХреЛ рдирд┐рдЧрд░рд╛рдиреА рдореЗрдВ рдХреИрд╕реЗ рдорджрдж рдХрд░рддрд╛ рд╣реИ ?
What is Zookeeper ? How does it help in monitoring a cluster ?
5.
NoSQL рдХрд╛ рдЙрджреНрдпреЛрдЧ рдореЗрдВ рдХреНрдпрд╛ рдЙрдкрдпреЛрдЧ рд╣реИ ? рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреАрдЬрд┐рдП ред
What is use of NoSQL in Industry ? Explain.
рдЕрдерд╡рд╛ (Or)
RDDs рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдкрд░ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЯрд┐рдкреНрдкрдгреА рд▓рд┐рдЦрд┐рдП ред
Write a short note on RDDs programming.
6.
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рдХрд┐рд╕реА рдПрдХ рдкрд░ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЯрд┐рдкреНрдкрдгреА рд▓рд┐рдЦрд┐рдП :
Write short note on the following (any one) :
(рдЕ) R рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдХреЗ рд╕рд╛рде рдбреЗрдЯрд╛ рдПрдирд╛рд▓рд┐рдЯрд┐рдХреНрд╕
(a) Data Analytics with R Machine Learning
(рдм) рд╕рд╣рдпреЛрдЧреА рдлрд┐рд▓реНрдЯрд░рд┐рдВрдЧ ред
(b) Collaborative Filtering.
рдЦрдгреНрдб 'рд╕'
Section C
(рджреАрд░реНрдШ рдЙрддреНрддрд░реАрдп рдкреНрд░рд╢реНрди)
(Long Answer Type Questions)
5├Ч9=45
рдиреЛрдЯ : рд╕рднреА рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рдЙрддреНрддрд░ рджреАрдЬрд┐рдП ред рдкреНрд░рддреНрдпреЗрдХ рдкреНрд░рд╢реНрди рдХреЗ рдЕрдВрдХ рд╕рдорд╛рди рд╣реИрдВ ред
Attempt all questions. Each question carries equal marks.
7.
рдмрд┐рдЧ рдбреЗрдЯрд╛ рдХреНрдпрд╛ рд╣реИ ? рдЙрджрд╛рд╣рд░рдг рдХреЗ рд╕рд╛рде рдЗрд╕рдХреЗ рдЪрд╛рд░ 'V' рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреАрдЬрд┐рдП ред
What is a big data ? Discuss its four 'V' with example.
рдЕрдерд╡рд╛ (Or)
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд╕рд╛рде рдореИрдкрд░рд┐рдбреНрдпреВрд╕ рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдХреЛ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреАрдЬрд┐рдП ред
Explain MapReduce algorithm with example.
8.
рд╣рдбреВрдк рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдкрд░ рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss Hadoop Architecture.
рдЕрдерд╡рд╛ (Or)
рдЕрдкрд╛рдЪреЗ рд╣рдбреВрдк рдФрд░ рд╣рдбреВрдк рдЗрдХреЛрд╕рд┐рд╕реНрдЯрдо рдкрд░ рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss Apache Hadoop and Hadoop Ecosystem.
9.
рд╣рд╛рдЗрд╡ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдкрд░ рдЖрд░реЗрдЦ рдХреЗ рд╕рд╛рде рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss Hive Architecture with diagram.
рдЕрдерд╡рд╛ (Or)
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд╕рд╛рде рдЬреЙрдЗрди рдФрд░ рд╕рдм-рдХреНрд╡реЗрд░реА рдкрд░ рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss Joins and Sub-queries with example.
10.
NoSQL рдбреЗрдЯрд╛рдмреЗрд╕ рдкрд░ рдЙрдирдХреЗ рд▓рд╛рднреЛрдВ рдХреЗ рд╕рд╛рде рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред рдпрд╣ SQL рд╕реЗ рдХрд┐рд╕ рдкреНрд░рдХрд╛рд░ рднрд┐рдиреНрди рд╣реИ ? рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреАрдЬрд┐рдП ред
Discuss NoSQL database with their advantages. How does it differ from SQL ? Explain.
11.
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд╕рд╛рде рдкрд░реНрдпрд╡реЗрдХреНрд╖рд┐рдд рд╢рд┐рдХреНрд╖рд╛ рдкрд░ рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss supervised learning with example.
рдЕрдерд╡рд╛ (Or)
рдЕрдкрд░реНрдпрд╡реЗрдХреНрд╖рд┐рдд рд╢рд┐рдХреНрд╖рд╛ рдкрд░ рдЙрджрд╛рд╣рд░рдг рд╕рд╣рд┐рдд рдЪрд░реНрдЪрд╛ рдХреАрдЬрд┐рдП ред
Discuss Unsupervised learning with example.