Чем открыть график csv
Редактируем CSV-файлы, чтобы не сломать данные
Продукты HFLabs в промышленных объемах обрабатывают данные: адреса, ФИО, реквизиты компаний и еще вагон всего. Естественно, тестировщики ежедневно с этими данными имеют дело: обновляют тест-кейсы, изучают результаты очистки. Часто заказчики дают «живую» базу, чтобы тестировщик настроил сервис под нее.
Первое, чему мы учим новых QA — сохранять данные в первозданном виде. Все по заветам: «Не навреди». В статье я расскажу, как аккуратно работать с CSV-файлами в Excel и Open Office. Советы помогут ничего не испортить, сохранить информацию после редактирования и в целом чувствовать себя увереннее.
Материал базовый, профессионалы совершенно точно заскучают.
Что такое CSV-файлы
Формат CSV используют, чтобы хранить таблицы в текстовых файлах. Данные очень часто упаковывают именно в таблицы, поэтому CSV-файлы очень популярны.
CSV-файл состоит из строк с данными и разделителей, которые обозначают границы столбцов
CSV расшифровывается как comma-separated values — «значения, разделенные запятыми». Но пусть название вас не обманет: разделителями столбцов в CSV-файле могут служить и точки с запятой, и знаки табуляции. Это все равно будет CSV-файл.
У CSV куча плюсов перед тем же форматом Excel: текстовые файлы просты как пуговица, открываются быстро, читаются на любом устройстве и в любой среде без дополнительных инструментов.
Из-за своих преимуществ CSV — сверхпопулярный формат обмена данными, хотя ему уже лет 40. CSV используют прикладные промышленные программы, в него выгружают данные из баз.
Одна беда — текстового редактора для работы с CSV мало. Еще ничего, если таблица простая: в первом поле ID одной длины, во втором дата одного формата, а в третьем какой-нибудь адрес. Но когда поля разной длины и их больше трех, начинаются мучения.
Следить за разделителями и столбцами — глаза сломаешь
Еще хуже с анализом данных — попробуй «Блокнотом» хотя бы сложить все числа в столбце. Я уж не говорю о красивых графиках.
Поэтому CSV-файлы анализируют и редактируют в Excel и аналогах: Open Office, LibreOffice и прочих.
Ветеранам, которые все же дочитали: ребята, мы знаем об анализе непосредственно в БД c помощью SQL, знаем о Tableau и Talend Open Studio. Это статья для начинающих, а на базовом уровне и небольшом объеме данных Excel с аналогами хватает.
Как Excel портит данные: из классики
Все бы ничего, но Excel, едва открыв CSV-файл, начинает свои лукавые выкрутасы. Он без спроса меняет данные так, что те приходят в негодность. Причем делает это совершенно незаметно. Из-за этого в свое время мы схватили ворох проблем.
Большинство казусов связано с тем, что программа без спроса преобразует строки с набором цифр в числа.
Округляет. Например, в исходной ячейке два телефона хранятся через запятую без пробелов: «5235834,5235835». Что сделает Excel? Лихо превратит номера́ в одно число и округлит до двух цифр после запятой: «5235834,52». Так мы потеряем второй телефон.
Приводит к экспоненциальной форме. Excel заботливо преобразует «123456789012345» в число «1,2E+15». Исходное значение потеряем напрочь.
Проблема актуальна для длинных, символов по пятнадцать, цифровых строк. Например, КЛАДР-кодов (это такой государственный идентификатор адресного объекта: го́рода, у́лицы, до́ма).
Удаляет лидирующие плюсы. Excel считает, что плюс в начале строки с цифрами — совершенно лишний символ. Мол, и так ясно, что число положительное, коль перед ним не стоит минус. Поэтому лидирующий плюс в номере «+74955235834» будет отброшен за ненадобностью — получится «74955235834». (В реальности номер пострадает еще сильнее, но для наглядности обойдусь плюсом).
Потеря плюса критична, например, если данные пойдут в стороннюю систему, а та при импорте жестко проверяет формат.
Разбивает по три цифры. Цифровую строку длиннее трех символов Excel, добрая душа, аккуратно разберет. Например, «8 495 5235834» превратит в «84 955 235 834».
Форматирование важно как минимум для телефонных номеров: пробелы отделяют коды страны и города от остального номера и друг от друга. Excel запросто нарушает правильное членение телефона.
Удаляет лидирующие нули. Строку «00523446» Excel превратит в «523446».
А в ИНН, например, первые две цифры — это код региона. Для Республики Алтай он начинается с нуля — «04». Без нуля смысл номера исказится, а проверку формата ИНН вообще не пройдет.
Меняет даты под локальные настройки. Excel с удовольствием исправит номер дома «1/2» на «01.фев». Потому что Windows подсказал, что в таком виде вам удобнее считывать даты.
Побеждаем порчу данных правильным импортом
Если серьезно, в бедах виноват не Excel целиком, а неочевидный способ импорта данных в программу.
По умолчанию Excel применяет к данным в загруженном CSV-файле тип «General» — общий. Из-за него программа распознает цифровые строки как числа. Такой порядок можно победить, используя встроенный инструмент импорта.
Запускаю встроенный в Excel механизм импорта. В меню это «Data → Get External Data → From Text».
Выбираю CSV-файл с данными, открывается диалог. В диалоге кликаю на тип файла Delimited (с разделителями). Кодировка — та, что в файле, обычно определяется автоматом. Если первая строка файла — шапка, отмечаю «My Data Has Headers».
Перехожу ко второму шагу диалога. Выбираю разделитель полей (обычно это точка с запятой — semicolon). Отключаю «Treat consecutive delimiters as one», а «Text qualifier» выставляю в «
На третьем шаге выбираю формат полей, ради него все и затевалось. Для всех столбцов выставляю тип «Text». Кстати, если кликнуть на первую колонку, зажать шифт и кликнуть на последнюю, выделятся сразу все столбцы. Удобно.
Дальше Excel спросит, куда вставлять данные из CSV — можно просто нажать «OK», и данные появятся в открытом листе.
Перед импортом придется создать в Excel новый workbook
Но! Если я планирую добавлять данные в CSV через Excel, придется сделать еще кое-что.
После импорта нужно принудительно привести все-все ячейки на листе к формату «Text». Иначе новые поля приобретут все тот же тип «General».
После этого, если повезет, Excel оставит исходные данные в покое. Но это не самая твердая гарантия, поэтому мы после сохранения обязательно проверяем файл через текстовый просмотрщик.
Альтернатива: Open Office Calc
Для работы с CSV-файлами я использую именно Calc. Он не то чтобы совсем не считает цифровые данные строками, но хотя бы не применяет к ним переформатирование в соответствии с региональными настройками Windows. Да и импорт попроще.
Конечно, понадобится пакет Open Office (OO). При установке он предложит переназначить на себя файлы MS Office. Не рекомендую: хоть OO достаточно функционален, он не до конца понимает хитрое микрософтовское форматирование документов.
А вот назначить OO программой по умолчанию для CSV-файлов — вполне разумно. Сделать это можно после установки пакета.
Итак, запускаем импорт данных из CSV. После двойного клика на файле Open Office показывает диалог.
Заметьте, в OO не нужно создавать новый воркбук и принудительно запускать импорт, все само
Помимо Calc у нас в HFLabs популярен libreOffice, особенно под «Линуксом». И то, и другое для CSV применяют активнее, чем Excel.
Белая пустошь, раскинувшаяся посередине, в оригинальном CSV-файле богато заполнена данными
Поэтому после сохранения я еще раз открываю файл и убеждаюсь, что данные на месте.
После пересохранения обязательно еще раз проверяю, что все данные на месте и нет лишних пустых строк.
Если интересно работать с данными, посмотрите на наши вакансии. HFLabs почти всегда нужны аналитики, тестировщики, инженеры по внедрению, разработчики. Данными обеспечим так, что мало не покажется 🙂
Импорт содержимого CSV-файла в Excel
CSV – популярное расширение файлов, которые используются, в основном, для обмена данными между различными компьютерными программами. Чаще всего необходимости в открытии и редактировании таких документов нет. Однако в некоторых случаях перед пользователями может встать такая задача. Программа Excel позволяет это сделать, но в отличие от стандартных файлов в формате XLS и XLSX, простое открытие документа двойным щелчком мыши не всегда дает качественный результат, что может выражаться в некорректном отображении информации. Давайте посмотрим, каким образом можно открыть файлы с расширением CSV в Экселе.
Открываем CSV-файлы
Для начала давайте разберемся, что из себя представляют документы в данном формате.
CSV – аббревиатура, которая расшифровывается как “Comma-Separated Values” (на русском языке означает “значения, разделенные запятыми”).
Как следует из названия, в таких документах используются разделители:
Во время открытия документа в Excel основная задача (проблема) заключается в выборе способа кодировки, примененного при сохранении файла. Если будет выбрана не та кодировка, скорее всего, пользователь увидит множество нечитаемых символов, и полезность информации будет сведена к минимуму. Помимо этого, ключевое значение имеет используемый разделитель. Например, если документ был сохранен в англоязычной версии, а затем его пытаются открыть в русскоязычной, скорее всего, качество отображаемой информации пострадает. Причина, как мы ранее отметили, заключается в том, что в разных версиях используются разные разделители. Давайте посмотрим, как избежать этих проблем и как правильно открывать файлы CSV.
Метод 1: двойным щелчком или через контекстное меню
Прежде, чем приступить к более сложным методам, давайте рассмотрим самый простой. Он применим только в тех случаях, когда файл был создан/сохранен и открывается в одной и той же версии программы, а значит, проблем с кодировкой и разделителями быть не должно. Здесь возможно два варианта, опишем их ниже.
Excel установлена как программа по умолчанию для открытия CSV-файлов
Если это так, открыть документ можно как и любой другой файл – достаточно просто дважды щелкнуть по нему.
Для открытия CSV-фалов назначена другая программа или не назначена вовсе
Алгоритм действия в таких ситуациях следующий (на примере Windows 10):
Независимо от того, какой из описанных выше способов был выбран, результатом будет открытие CSV-файла. Как мы упомянули выше, корректно отображаться содержимое будет только при соответствии кодировки и разделителей.
В остальных случаях может показываться нечто подобное:
Поэтому описанный метод подходит не всегда, и мы переходим к следующим.
Метод 2: применяем Мастер текстов
Воспользуемся интегрированным в программу инструментом – Мастером текстов:
Метод 3: через меню “Файл”
И последний метод, которым можно воспользоваться заключается в следующем:
Заключение
Таким образом, несмотря на кажущуюся сложность, программа Эксель вполне позволяет открывать и работать с файлами в формате CSV. Главное – определиться с методом реализации. Если при обычном открытии документа (двойным щелчком мыши или через контекстное меню) его содержимое содержит непонятные символы, можно воспользоваться Мастером текста, который позволяет выбрать подходящую кодировку и знак разделителя, что напрямую влияет на корректность отображаемой информации.
Как корректно открыть в Exel файл формата CSV
О существовании и основных параметрах текстовых файлов значений с разделением запятыми знают, как правило, лишь те, кто работает с таблицами Excel. Для человека нового, не посвященного в особенности хранения и передачи табличных баз данных, даже простейшее открытие CSV-файлов может вызывать ряд проблем. Цель данной статьи — объяснить, как открыть файл CSV в Excel, и как бороться с неполадками в процессе их использования.
Что такое CSV
CSV — формат документа, представляющего собой текстовый файл со списком значений, между которыми стоит разделитель. В англоязычном варианте он так и переводится: «Comma-Separated Values» — значения, разделенные запятой. Другими словами, это текстовое представление табличной информации XLS/XLSX- таблиц Excel.
Проблема заключается в том, что этот формат не стандартизирован в полной мере, и из-за некорректных настроек текущего региона в Виндовс и кодировок пользователь может увидеть «тарабарщину» на экране вместо упорядоченной таблицы.
Варианты просмотра CSV-файла в Excel
От теории к практике — разбираемся, как открыть файл расширения CSV на примере ОС Windows 10.
Для этого есть 3 способа:
Рассмотрим каждый из указанных выше вариантов.
Простейший способ — из Проводника
Как открыть в Экселе файл CSV посредством файлового менеджера:
С разделением столбцов в Эксель
Данный способ более предпочтителен, так как позволяет выбрать кодировку символов, разделитель значений и прочие параметры для нормального вывода информации.
Процесс выглядит так:
Разделители нужны для правильного размещения значений в таблице, а формат задает кодировку символов (дабы не получить бред, именуемый в народе кракозябрами: «Oedieay yeaeode»).
Второй шаг отвечает за выбор варианта разделителя. В России используется точка с запятой — выбираем ее.
Последний шаг позволяет изменить формат данных столбцов таблицы. Это необязательная настройка, поэтому ее можно пропустить нажатием «Готово».
Перед импортом данных пользователю дается выбор куда их помещать. Оставляем галочку «Имеющийся лист» и кликаем по «ОК».
В результате получаем правильно сформированную таблицу в первоначальном виде.
Через вкладку «Файл»
Третий способ является чем-то средним между двумя первыми. Мы также пользуемся мастером текстов, но не вставляем данные в книгу, а открываем их отдельным файлом:
Запускаем любой XLS/XLSX документ и выбираем вкладку «Файл» и жмем «Обзор».
Кликаем по искомому CSV-элементу и подтверждаем кнопкой «Открыть».
Следуем аналогично пункту 3 второго способа.
Работа в Excel сразу с несколькими файлами CSV
Начиная с MS Office 2013, в Excel разработчики добавили полезное расширение Power Query, позволяющее удобнее работать с текстовыми базами данных и объединять их в одной таблице.
Чтобы объединить две CSV-таблицы в одной книге:
Теперь делаем аналогичное действие со вторым CSV-документом, после чего в строке «Запросы книги» появится два пункта с нашими данными;
Далее переходим «Создать запрос/Объединить запросы/Добавить» и в окошке отмечаем первичную и вторичную таблицу (первый и второй csv-файл);
После подтверждения создается объединенная база значений. Для ее импорта на лист Excel нажимаем «Закрыть и загрузить».
Особенности открытия с Android-устройств
CSV-данные нечасто используются в мобильной среде, но, например, они полезны для переноса контактов с памяти одного устройства на другое.
Так, скачав нужный файл, можно обновить книгу контактов Google. Кроме того, в Google-Play существуют бесплатные программы, вроде CSV Viewer или CSV File Viewer.
Приложения позволяющие просматривать, изменять и загружать из сети текстовые БД на андроиде.
Проблемы и их решения при открытии CSV
Рассматриваемый тип документа не стандартизирован окончательно, что приводит к частым ошибкам при его чтении. Рассмотрим основные проблемы и способы их решения.
Некорректное отображение CSV
Если вместо упорядоченных строчек и столбцов все значения сбрасываются в одну область, то проблема кроется в разных региональных настройках системы и файла. В первую очередь нужно:
Открыть «Пуск/Параметры»; (В windows 7 — Панельуправления)
Зайти во «Время и язык/Регион/Дополнительные параметры/Региональные стандарты/ снова Доп. параметры»;
«Разделитель целой и дробной части» должен быть запятой, а «Разделитель элементов списка» — точка с запятой.
Помимо этого, не забываем указывать разделитель в Мастере текстов.
Исчезновение нулей в числовых данных
При открытии баз данных отдельным файлом из проводника случается утеря идущих вначале нулей в числовых значениях. Это происходит из-за округления чисел в Excel.
Чтобы этого не случалось — откройте его вторым способом, описанным выше, но на 3 шаге не забудьте выделить проблемные столбцы и указать «Формат данных столбца» – текстовый.
Подмена числовых значений датой
Проблема аналогична предыдущей, только здесь числа могут интерпретироваться как даты. Решение проблемы то же — отмечайте неправильно интерпретированные столбцы в Мастере и меняйте формат на текстовый.
В заключение
Как видно из статьи, корректно открыть файл CSV в Excel — задача нетривиальная даже для опытного пользователя. Недостаток в виде плохой стандартизации делает его неудобным в использовании, нечитаемым в разных регионах с разными разделителями.
Но благодаря полезным плагинам вроде Power Query и знаний об особенностях подобных баз данных можно облегчить себе работу и исключить пропажу информации в документе.
Открываем формат CSV
CSV (Comma-Separated Values) представляет собой файл текстового формата, который предназначен для отображения табличных данных. При этом колонки разделяются запятой и точкой с запятой. Узнаем, с помощью каких приложений можно открыть данный формат.
Программы для работы с CSV
Как правило, для корректного просмотра содержимого CSV используются табличные процессоры, а для их редактирования можно применять и текстовые редакторы. Давайте подробнее рассмотрим алгоритм действий при открытии различными программами данного типа файлов.
Способ 1: Microsoft Excel
Рассмотрим, как запустить CSV в популярном текстовом процессоре Эксель, который входит в пакет Microsoft Office.
Существует ещё один метод перехода в «Мастер текстов».
Поэтому пользователь сам должен установить, служит ли в данном случае конкретный символ разделителем или является обычным знаком пунктуации. Это он может сделать, взглянув на текст, который отображается в области «Образец разбора данных» и основываясь на логике.
После определения пользователем того, какой именно знак является разделителем, в группе «Символом-разделителем является» следует установить флажок около пункта «Точка с запятой» или «Запятая». Со всех остальных пунктов флажки следует убрать. Затем нажимайте «Далее».
После выполнения манипуляций нажимайте «Готово».
Способ 2: LibreOffice Calc
Запускать CSV умеет и другой табличный процессор – Calc, входящий в сборку LibreOffice.
Также можете произвести переход через меню, нажав «Файл» и «Открыть…».
Кроме того, в окно открытия можно попасть и непосредственно через интерфейс Calс. Для этого, находясь в LibreOffice Calc, щелкайте по значку в виде папки или наберите Ctrl+O.
Ещё один вариант предусматривает последовательный переход по пунктам «Файл» и «Открыть…».
Но можно даже обойтись без запуска окна «Открыть». Для этого следует перетянуть CSV из «Проводника» в ЛибреОфис.
Сразу перейдите к группе настроек «Импорт». В области «Кодировка» выбирайте значение «Юникод (UTF-8)», если там отображается иное. В области «Язык» выберите язык текста. В области «Со строки» нужно указать, с какой именно строчки следует начинать импорт содержимого. В большинстве случаев в этот параметр изменение вносить не нужно.
Далее переходим к группе «Параметры разделителя». Прежде всего, необходимо установить радиокнопку в позицию «Разделитель». Далее по такому же принципу, который был рассмотрен при использовании Эксель, нужно указать, установив флажок напротив определенного пункта, что именно будет играть роль разделителя: точка с запятой или запятая.
«Другие параметры» оставляем без изменений.
Предварительно увидеть, как именно выглядит импортируемая информация при изменении тех или иных настроек, можно в нижней части окна. После введения всех необходимых параметров нажимайте «OK».
Способ 3: OpenOffice Calc
Просмотреть CSV можете с помощью ещё одного табличного процессора — OpenOffice Calc.
Также можете использовать меню. Для этого перейдите по пунктам «Файл» и «Открыть…».
Как и при использовании метода с предыдущей программой, добраться до окна открытия объекта можно прямо через интерфейс Кальк. В этом случае нужно нажать на иконку в образе папки или применить все то же Ctrl+O.
Также можете использовать меню, перейдя в нем по позициям «Файл» и «Открыть…».
Можно обойтись и без запуска этого окна, просто перетянув CSV из «Проводника» в ОупенОфис.
В блоке «Параметра разделителя» ставьте радиокнопку около пункта «Разделитель», после чего отметьте флажком тот пункт («Точка с запятой» или «Запятая»), который соответствует типу разделителя в документе.
После выполнения указанных действий, если данные в отображаемой в нижней части окна форме для предварительного просмотра отображаются корректно, нажимайте «OK».
Способ 4: Блокнот
Для редактирования можно применять обычный Блокнот.
Способ 5: Notepad++
Открывать можно и с помощью более продвинутого текстового редактора — Notepad++.
Ещё один вариант предполагает нажатие на панели по иконке в виде папки.
Способ 6: Safari
Просмотреть содержимое в текстовом варианте без возможности его редактирования можно в браузере Safari. Большинство других популярных браузеров такую возможность не предоставляют.
Способ 7: Microsoft Outlook
Некоторые объекты CSV представляют собой экспортированные из почтового клиента электронные письма. Их можно просматривать с помощью программы Microsoft Outlook, произведя процедуру импортирования.
Стоит, правда, заметить, что данным способом можно запустить далеко не все объекты формата CSV, а только письма, структура которых отвечает определенному стандарту, а именно содержащие поля: тема, текст, адрес отправителя, адрес получателя и др.
Как видим, существует довольно много программ для открытия объектов формата CSV. Как правило, лучше всего просматривать содержимое таких файлов в табличных процессорах. Редактирование можно выполнять в виде текста в текстовых редакторах. Кроме того, существуют отдельные CSV с определенной структурой, с которыми работают специализированные программы, например почтовые клиенты.
Помимо этой статьи, на сайте еще 12513 инструкций.
Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.
Отблагодарите автора, поделитесь статьей в социальных сетях.