Data Science Interview questions for Oracle

What is data science?

[{"selector":"#anim-12486d67-e23e-462d-9fc4-c5080d695031","keyframes":{"transform":["translate3d(-118.21191%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-459279ac-07da-405a-a4c9-a7b3ee672b7e","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0d01e1e0-ab73-4c84-bde8-dc505390f9e6","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] [{"selector":"#anim-fcc2635d-144d-4e00-8f32-38b01b2f3a9b","keyframes":{"transform":["translate3d(120.20202%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-55222a8c-dbd0-459c-9b98-ae6059dc64ae","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-39898006-f75e-4cfc-b59b-1e82bedbbc11","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] [{"selector":"#anim-70f56d4f-da68-4e0b-95ee-eed2690aea7d [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.23219136830804%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] Data science is an interdisciplinary field that uses scientific methods, processes, algorithms, and systems to extract knowledge and insights from structured and unstructured data. It combines techniques from statistics, machine learning, data analysis, and domain knowledge to inform decision-making.

What is a data pipeline?

[{"selector":"#anim-907cee34-7a40-4cff-b3f6-67916a1a4246","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-31a9a0a6-e905-4adb-99e3-35cf1c1de8f2","keyframes":{"transform":["translate3d(-139.58333%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-43cfe9b3-fe9a-4c32-8df2-6fa7c9ac3efb [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(7.812499744007886%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-faa45af1-de2a-45b8-9b8c-b819f197933b","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-762d24ea-f3f9-4227-b948-e826806eb7bd","keyframes":{"transform":["translate3d(119.19192%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] A data pipeline is a series of data processing steps that involve the collection, processing, and transformation of data from one system to another.

What is cross-validation?

[{"selector":"#anim-ef6b4e65-07de-4ce5-8cb4-ca76d7aaab31 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-7.812499744007886%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-d66f9ec9-8d73-4f64-a588-f4bfc36d231c","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-784c07dc-1293-49c4-b2cf-99a54afdbdf7","keyframes":{"transform":["translate3d(0px, 401.69735%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-bf3bbe74-b33b-48fb-ab3c-83facaf4e833","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-3093eab4-6bb0-4c36-97b8-b0be26e858a9","keyframes":{"transform":["translate3d(0px, -735.97901%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] Cross-validation is a technique used to assess the performance of a machine learning model by dividing the data into multiple subsets (folds).

What is the ROC curve?

[{"selector":"#anim-791c894d-7935-4c6e-94f5-8b854b19e104 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-da2042fd-5183-42f6-aa47-9b38cb74a3c5","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ed6dc937-79e1-451b-b475-868c039748e8","keyframes":{"transform":["translate3d(-118.21191%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-23bf874d-3945-479a-8df3-3df5f89afc7c","keyframes":{"opacity":[0,1]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c1d80268-bcbe-46fc-be74-f333c25fa4db","keyframes":{"transform":["translate3d(119.19192%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":2600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] The Receiver Operating Characteristic (ROC) curve is a graphical representation of a classifier’s performance across different threshold values. Learn more