- BI (бизнес-аналитику) в компании применяют для…
- прогнозирования финансового состояния
- распределения премий между сотрудниками
- анализа инновационных товаров
- Big Data отражает эффект (феномен)…
- разнообразия данных
- BigData – это …
- Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
- Колоссальный объем данных, собранных человечеством
- Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для…
- Принятия решений в различных сферах человеческой деятельности
- Уменьшения стоимости анализа данных
- Hadoop – это…
- набор утилит, и программный каркас для выполнения распределённых программ, работающих на кластерах
- R не является…
- языком программирования с динамической типизацией данных
- Аналитик это …
- специалист в области анализа и моделирования
- человек, который имеет опыт в программировании
- В 2016 году программа AlphaGo обыграла одного из мировых по шахматам чемпионов Ли Седоля. Какая компания разработала ИИ AlphaGo?
- В Big Data возможны…
- разные типы и области происхождения данных
- В Big Data не акцентируется…
- Voicing (Озвучивание)
- В базе данных есть следующие записи: длительность звонков, общее число звонков, общее число переданных сообщений, количество потраченных гигабайтов трафика. Вы хотите предсказывать объем трафика, который потратят клиенты. Что будет объектом модели в этой задаче?
- Клиент
- В какие игры нейросеть еще не научилась обыгрывать человека?
- Бридж
- В каком году впервые был введен термин Большие данные?
- 2008
- В каком из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?
- потоковая обработка логов кластера серверов и быстрого сохранения без требования оперативной аналитики
- В краудсорсинге вклад в проект каждого участника осуществляется…
- ресурсами – компьютер, время и др.
- В краудсорсинге могут быть задействованы…
- профессионалы и любители
- В любых Big Data информация целиком распределена…
- по всей сети
- В результате использования инструментов Data Mining пользователь может …
- Получить подтверждение или опровержение гипотез, выдвинутых пользователем
- В чём преимущество колоночно-ориентированных СУБД?
- они имеют более гибкие возможности аналитики
- Вы взяли среднесуточные температуры за последние два года и построили регрессионную модель для прогнозирования дневного спроса на товары. Для мороженого она работает хорошо, а для шуб плохо. Почему?
- Шубы продают нечасто — мало данных
- Выберите верное высказывание…
- проблема больших данных – это такая проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна
- Выберите неверное высказывание про MapReduce…
- MapReduce был придуман разработчиками Hadoop
- Выберите неверное высказывание…
- большие данные – это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров
- Выберите технологию потоковой обработки событий в режиме реального времени
- Apache Kafka
- Spark Streaming
- Горизонтальная масштабируемость при обработке Big Data – это…
- увеличение скорости обработки при росте объема данных
- Дайте определение Big Data
- Комплексный набор подходов, инструментов и методов обработки структурированных и неструктурированных данных колоссальных объемов
- Дайте определение Map Reduce…
- Модель распределенных вычислений, предназначенная для параллельных вычислений над очень большими (до нескольких петабайт) объемами данных
- Данные могут быть получены в результате...
- Измерений
- Экспериментов
- Арифметических и логических операций
- Данные представляют собой...
- Факты и графики
- Текст
- Картинки, звуки, аналоговые или цифровые видео-сегменты
- Для машинного обучения подходят данные…
- Любых форматов в цифровом виде
- Предварительно подготовленные, очищенные от ошибок, пропусков и выбросов, а также нормализованные и представленные в виде числовых векторов
- Для обработки больших данных наиболее актуально…
- привлечь больше вычислительных мощностей для обработки
- ускорить обработку или увеличить объем обрабатываемых данных
- До появления Big Data невозможно было…
- обрабатывать всю вузовскую информацию полностью
- работать с данными дистанционного зондирования Земли
- До появления Data Mining невозможно было найти связи…
- студентов вуза и их успеваемости по предмету
- рекламирования и покупательской активности на сайте веб-магазина
- Допустим, нам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения нам в этом пригодится?
- Компьютерное зрение
- Закончите следующее предложение: "С точки зрения машины, информация становится структурированной, если...
- Машина проинструктирована, каким образом её обрабатывать
- Изначально Big Data применяли лишь в…
- академической среде
- Интеллектуальный анализ данных или Data Mining…
- Информация, которая организована и проанализирована с целью сделать ее понятной и применимой для решения задачи или принятия решений.
- Искусственные нейронные сети (ИНС) — модели машинного обучения, использующие комбинации распределенных простых операций, зависящих от обучаемых параметров, для обработки входных данных. Какого вида ИНС не существует?
- Наивные
- Итак, вы решили работать с большими данными. Какой из этих инструментов вам вряд ли пригодится?
- Texmaker
- Как происходит обучение нейронной сети?
- сеть запускается на обучающем множестве, и подстраиваются весовые значения
- Какая компания создала технологию MapReduce?
- Какая информация о пациентах, находящаяся в распоряжении медицинской организации, относится к персональным данным?
- Диагнозы конкретных пациентов
- Данные из электронной медицинской карты без Ф.И.О.: дата рождения, адрес регистрации и пр.
- Какая компания создала технологию MapReduce?
- Какие задачи решают графовые БД?
- встроенная обработка данных сетевыми методами
- Какие из задач решаются Big Data?
- Все вышеперечисленное
- Какие из следующих технологий СУБД не используют принцип MapReduce?
- Cassandra
- Redis
- Какие модули по умолчанию входят в состав проекта Apache Hadoop?
- HDFS
- MapReduce
- YARN
- Какое API было добавлено в Hadoop v2.0?
- YARN
- Какое из нижеперечисленных понятий не относится к перечню необходимых критериев для создания проекта, связанного с Большими данными?
- Географическое положение
- Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?
- ключ-значение
- Какой язык программирования из перечисленных является наиболее важным для аналитика?
- R
- Краудсорсинг – модель привлечения…
- неограниченного числа и потенциала участников
- Краудсорсинг большого проекта невозможен без…
- декомпозиции
- Кто ввел термин Большие данные?
- Клиффорд Линч
- Кто и в каком году впервые ввел термин «Big Data»?
- Клиффорд Линч, редактор журнала Nature, в 2008 году
- Локальность данных Big Data – это…
- время коммуникации не может быть выше времени обработки
- На каком языке программирования можно разрабатывать приложения Hadoop MapReduce?
- Практически на любом: Java, C++ и другие компилируемые языки
- На основе какого языка был создан R?
- S
- Недостатком краудсорсинга является…
- ограниченная мотивация
- Нейросети хорошо проявляют себя не только в распознавании, но и в генерации изображений. Но кое с чем у них все-таки возникают проблемы. С чем именно?
- Текстуры
- Обрабатывать большие данные (Big Data) лет десять назад мешали…
- недостаточные вычислительные мощности
- Одна из главных целей Big Data – это…
- нижение издержек операций
- Одна из главных целей Data Mining – это получение…
- связей малых выборок данных, распространение их на большие массивы
- Основными достоинствами краудсорсинга являются…
- оперативность реализации проекта и распределения прибыли
- Особых успехов нейросети достигли в работе с изображениями. Но что из этого нейросети не могут сделать?
- Догадаться, что вы нарисовали
- Отказоустойчивость Big Data – это, когда…
- сбой в одном звене системы не ведет к сбоям в других звеньях
- Отметьте верное понимание Variety в контексте характеристик Big Data…
- разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
- Отметьте причину создания NoSQL баз данных…
- высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности
- Перечислите четыре основных характеристики Big Data…
- Variety, Velocity, Volume, Value
- Подходы к построению моделей Data Mining
- статистический и на основании машинного обучения
- Пример благоразумного использования Hadoop…
- посекундное сохранение данных температуры, поступающих со всех городов России (по одному показанию на город, всего городов 1100 шт)
- Примером применения Big Data не может быть…
- родительский контроль
- Принцип 3Vs расшифровывается как...
- Volume, Variety, Velocity
- Принципом Big Data не является…
- локализация данных
- Расписание движения поездов может рассматриваться как пример…
- Табличной модели
- С помощью Big Data клиентский компьютер может обрабатывать до…
- терабайтов данных
- Сколько Петабайт в Зеттабайте?
- 1024
- Специалист по работе с данными знает и умеет многое, но нельзя знать всего. Чего не преподают на курсах по Data Science?
- Масс-спектрометрия
- Теперь вам нужно обучить нейросеть распознавать на фото воздушные шары. Коллега предлагает перевести все изображения для обучения нейросети в черно-белые. Что вы ответите?
- Нет, потому что это ухудшит результат
- Традиционные методы визуализации могут находить следующее применение…
- Представлять пользователю информацию в наглядном виде
- Компактно описывать закономерности, присущие исходному набору данных
- Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?
- хранить данные с изменяющейся структурой
- Чем глубокое обучение отличается от машинного?
- Машинное обучение изучает алгоритмы, обучающиеся без использования специального свода правил, а глубокое обучение — это машинное обучение нейронных сетей с более чем тремя скрытыми слоями нейронов
- Чем искусственная нейронная сеть похожа на естественные нейронные сети в мозге?
- Их объединяет лишь общий принцип построения: это последовательность связанных друг с другом нейронов
- Что будет объектом в задаче поиска уходящих от компании клиентов?
- Клиент
- Что из перечисленного помогает следить за эволюцией документа, над созданием которого работает одновременно большое количество авторов?
- Исторический поток
- Что из этого не является типом визуализации?
- Текст
- Что не является целью процесса Business Intelligence?
- Модификация существующего программного обеспечения
- Что необходимо выполнить, чтобы нейросеть могла помочь в формировании решения…
- Обучить на примерах
- Что означает термин «Big Data» в информационных технологиях?
- Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
- Что означает термин «Business Intelligence» в информационных технологиях?
- Методы и инструменты для перевода необработанной информации в осмысленную, удобную для восприятия форму
- Что означает термин NoSQL?
- Не только SQL
- Что такое EDA?
- Исследовательский анализ данных
- Что такое Spark?
- Технология распределенных вычислений
- Что такое SQL?
- Язык структурированных запросов
- Что такое БУСТИНГ?
- Построение ансамбля моделей машинного обучения
- Эффективно применять Data Mining с целью защиты от…
- мошенников
Введение в технологии Big Data - Ответы на тест Синергия
июня 04, 2024