Автор Тема: zip-архивы и кириллица  (Прочитано 21102 раз)

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 146
zip-архивы и кириллица
« : 31.01.2021 20:57:47 »
У кого-нибудь в графических утилитах для работы с архивами для p9 (Ark, File-Roller и т.д.) видно что-то кроме кракозябр в архивах типа https://zakupki.gov.ru/epz/main/public/download/downloadDocument.html?id=32538 ?
Во времена p4 это было решено, но теперь про это забыли и всё поломали...

Оффлайн Koi

  • alt linux team
  • ***
  • Сообщений: 1 891
  • валар дохаэрис
    • Канал на youtube
Re: zip-архивы и кириллица
« Ответ #1 : 31.01.2021 22:16:58 »


Это происходит из-за архиватора. Вот пример открытия вашего архива p7zip.
$ 7z l q.zip

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=ru_RU.UTF-8,Utf16=on,HugeFiles=on,64 bits,4 CPUs Intel(R) Core(TM) i3 CPU       M 380  @ 2.53GHz (20655),ASM)

Scanning the drive for archives:
1 file, 1051 bytes (2 KiB)

Listing archive: q.zip

--
Path = q.zip
Type = zip
Physical Size = 1051

   Date      Time    Attr         Size   Compressed  Name
------------------- ----- ------------ ------------  ------------------------
2020-02-20 18:21:14 ....A         1304          745  ¥àâ¨ä¨ª â ¨­ª®¬á¢ï§¨ ®áᨨ (®«®¢­®£® 㤮á⮢¥àïî饣® 業âà )   34.10-2012.cer
------------------- ----- ------------ ------------  ------------------------
2020-02-20 18:21:14               1304          745  1 files

А так открывает unzip.
$ unzip -l q.zip
Archive:  q.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
     1304  2020-02-20 18:21   Сертификат Минкомсвязи России (Головного удостоверяющего центра) ГОСТ Р 34.10-2012.cer
---------                     -------
     1304                     1 file

Оффлайн berkut_174

  • Мастер
  • ***
  • Сообщений: 7 085
    • Email
Re: zip-архивы и кириллица
« Ответ #2 : 31.01.2021 22:26:37 »
yaleks
регулярно с этим сталкиваюсь по сей день, ничего не решено, всегда так было https://forum.altlinux.org/index.php?topic=41991.0
этим ещё грешат архивы созданные гуглом, майлом и прочими

ps. кстати, сейчас и engrampa ваш архив открыла с кракозябрами
Сноси Винду, переходи на Линукс ! :)

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 146
Re: zip-архивы и кириллица
« Ответ #3 : 31.01.2021 23:35:11 »
ps. кстати, сейчас и engrampa ваш архив открыла с кракозябрами
вот он в первую очередь сейчас и интересует...
7zip удалить нельзя, т.к. в нем архивы тоже бывают.

Ха! оказывается я даже баг создавал - https://bugzilla.altlinux.org/show_bug.cgi?id=31806 , но альтовцам пофиг.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #4 : 31.01.2021 23:35:42 »
Это происходит из-за архиватора.

М-гу.
Тут народ говорит, что это проблема линукс-билда:
https://sourceforge.net/p/p7zip/discussion/383044/thread/3d213124/
https://sourceforge.net/p/p7zip/bugs/187/

Это проблема линукс версии (не виндоус версии) и проблема эта старая:
https://sourceforge.net/p/p7zip/discussion/383044/thread/3d213124/#089f
https://sourceforge.net/p/p7zip/discussion/383044/thread/3d213124/#ce41/dc63
« Последнее редактирование: 31.01.2021 23:39:42 от Speccyfighter »

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #5 : 01.02.2021 01:18:51 »
Ха! оказывается я даже баг создавал - https://bugzilla.altlinux.org/show_bug.cgi?id=31806 ,

:-) unxed говорит что сделал патч для ручной установки кодовой страницы через OEMCP:
https://unix.stackexchange.com/questions/305886/how-to-specify-character-encoding-for-7z

но альтовцам пофиг.

:-) Альты глухо сидят на апстриме и слезать с него не хотят. А апстримный p7zip последние годы, скоро уже лет пять как труп (и unxed отправил патч в другую ветку)
https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=965126#15

и активно обновляется только под Windows
https://www.7-zip.org/history.txt

Такие дела...
Выше там тоже ссылки и unxed в тех обсуждениях тоже участвует.
Алкис Георгопулос говорит что патч работает в Ubuntu 20.04 и отправил его в ppa
https://sourceforge.net/p/p7zip/bugs/187/#368c

Оффлайн YYY

  • Мастер
  • ***
  • Сообщений: 5 801
Re: zip-архивы и кириллица
« Ответ #6 : 01.02.2021 02:18:53 »
У кого-нибудь в графических утилитах для работы с архивами для p9 (Ark, File-Roller и т.д.) видно что-то кроме кракозябр в архивах

старый добрый xarchiver ?

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #7 : 01.02.2021 13:38:39 »
Угу. Из коробки:

Оффлайн berkut_174

  • Мастер
  • ***
  • Сообщений: 7 085
    • Email
Re: zip-архивы и кириллица
« Ответ #8 : 01.02.2021 13:56:35 »
старый добрый xarchiver ?
он половины реальных архивов нормально открыть не может... эту проблему он может и решит, но добавит массу других
я давно им не пользовался, но когда присматривался, то он явно хуже открывал различные архивы, чем тот же file roller
Сноси Винду, переходи на Линукс ! :)

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 146
Re: zip-архивы и кириллица
« Ответ #9 : 01.02.2021 15:46:36 »
unxed говорит что сделал патч для ручной установки кодовой страницы через OEMCP:
https://unix.stackexchange.com/questions/305886/how-to-specify-character-encoding-for-7z
надо проверять, то в natspec вроде более заковыристая логика была заложена.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #10 : 01.02.2021 17:06:54 »
старый добрый xarchiver ?
он половины реальных архивов нормально открыть не может... эту проблему он может и решит, но добавит массу других
я давно им не пользовался, но когда присматривался, то он явно хуже открывал различные архивы, чем тот же file roller

В альтах древняя неподдерживаемая версия xarchiver
Xarchiver is not handling rar files #3
https://github.com/ib/xarchiver/issues/3

$ rpm -q --changelog xarchiver | head -n 4
* Вт июл 26 2016 Mikhail Efremov <sem@altlinux.org> 0.5.4-alt2
- Fix detection of a tar program (closes: #32303).
- Fix crash when cancelling progress bar.


И ей уже почти 6 лет
https://github.com/ib/xarchiver/releases?after=0.5.4.8

8 дней назад появилась версия 0.5.4.17
https://github.com/ib/xarchiver/releases
https://github.com/ib/xarchiver/releases/tag/0.5.4.17

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 19 287
    • Домашняя страница
    • Email
Re: zip-архивы и кириллица
« Ответ #11 : 01.02.2021 17:21:36 »
старый добрый xarchiver ?
он половины реальных архивов нормально открыть не может... эту проблему он может и решит, но добавит массу других
я давно им не пользовался, но когда присматривался, то он явно хуже открывал различные архивы, чем тот же file roller

В альтах древняя неподдерживаемая версия xarchiver
Xarchiver is not handling rar files #3
https://github.com/ib/xarchiver/issues/3

$ rpm -q --changelog xarchiver | head -n 4
* Вт июл 26 2016 Mikhail Efremov <sem@altlinux.org> 0.5.4-alt2
- Fix detection of a tar program (closes: #32303).
- Fix crash when cancelling progress bar.


И ей уже почти 6 лет
https://github.com/ib/xarchiver/releases?after=0.5.4.8

8 дней назад появилась версия 0.5.4.17
https://github.com/ib/xarchiver/releases
https://github.com/ib/xarchiver/releases/tag/0.5.4.17
bugs.altlinux.org
Андрей Черепанов (cas@)

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #12 : 01.02.2021 17:33:18 »
старый добрый xarchiver ?
он половины реальных архивов нормально открыть не может... эту проблему он может и решит, но добавит массу других
я давно им не пользовался, но когда присматривался, то он явно хуже открывал различные архивы, чем тот же file roller

В альтах древняя неподдерживаемая версия xarchiver
Xarchiver is not handling rar files #3
https://github.com/ib/xarchiver/issues/3

$ rpm -q --changelog xarchiver | head -n 4
* Вт июл 26 2016 Mikhail Efremov <sem@altlinux.org> 0.5.4-alt2
- Fix detection of a tar program (closes: #32303).
- Fix crash when cancelling progress bar.


И ей уже почти 6 лет
https://github.com/ib/xarchiver/releases?after=0.5.4.8

8 дней назад появилась версия 0.5.4.17
https://github.com/ib/xarchiver/releases
https://github.com/ib/xarchiver/releases/tag/0.5.4.17
bugs.altlinux.org

Добро. Сделаю.

Оффлайн Speccyfighter

  • Мастер
  • ***
  • Сообщений: 9 953
Re: zip-архивы и кириллица
« Ответ #13 : 02.02.2021 00:50:51 »
Так народ. Отправку багрепорта задержал. Чтобы несколько более досконально посмотреть, что имеем в альтах на текущий момент вообще. Моё имхо подсказывает, что спешка здесь не к месту.

И на текущий момент ситуация такова:

p9/branch:

Система:
alt-p9-xfce-sysv

Пакеты:
xarchiver-0.5.4-alt2
unrar-5.5.8-alt1

Результат:
Отказ открытия архиватором xarchiver-0.5.4-alt2 тестового архива RAR 4. Окно xarchiver пустое.

sisyphus:

Система:
без апгрейда
$ cat /image/.disk/info
ALT regular-xfce-sysv/x86_64 build 2020-12-11

Пакеты:
unrar в зависимостях у xarchiver отсутствует, - требуется установка
$ rpm -qi xarchiver | grep 'Vers\|URL\|Build Date'
Version     : 0.5.4.14.0.35.g47ca4c0
Build Date  : Пт 20 дек 2019 15:46:18
URL         : http://xarchiver.sourceforge.net/
$ rpm -qi unrar | grep 'Vers\|URL\|Build Date'
Version     : 5.8.5
Build Date  : Чт 23 янв 2020 19:50:08
URL         : http://www.rarlab.com

Тестовый архив:
$ unrar lt ./bptest.rar | head -n 12

UNRAR 5.80 freeware      Copyright (c) 1993-2019 Alexander Roshal

Archive: ./bptest.rar
Details: RAR 4

        Name: BPTtest
        Type: Directory
       mtime: 2010-01-16 14:15:58,000000000
  Attributes: ...D...
       CRC32: 00000000
     Host OS: Windows

Результат:
Архив rar4 в xarchiver открывается и распаковывается.
Результат на скриншоте во вложении.

В актуальном сизифе, xarchiver ещё свежЕе, максимум недельной давности:
# apt-cache show xarchiver
Package: xarchiver
Section: File tools
Installed Size: 1555269
Maintainer: Xfce Team <xfce@packages.altlinux.org>
Version: 0.5.4.17-alt1:sisyphus+265436.100.1.1@1611857266
...
Provides: xarchiver (= 0.5.4.17-alt1:sisyphus+265436.100.1.1)
Architecture: x86_64
Size: 487091
MD5Sum: ada3dd96233f71c04d222ff58d5c0d6a
Filename: xarchiver-0.5.4.17-alt1.x86_64.rpm
Description: A GTK+2 only archive manager
 Xarchiver is a lightweight GTK2 only frontend for manipulating 7z, arj,
 bzip2, gzip, iso, rar, lha, tar, zip, RPM and deb files. It allows you
 to create archives and add, extract, and delete files from them.
 Password protected archives in the arj, 7z, rar, and zip formats are
 supported.
Changelog:
 * Чт янв 28 2021 Fr. Br. George <george@altlinux.ru> 0.5.4.17-alt1
 - Autobuild version bump to 0.5.4.17
...
https://github.com/ib/xarchiver/releases


Просьба:
Сделайте кто-нибудь в Windows тестовый архив RAR5 или что там. В кириллице. 1-2 мегабайта. Нужно для теста. Содержимое не имеет значения. В плане проверки актуальности версии unrar в p9: в сизифе unrar свежЕе чем в p9.
Для теста контрольным заходом.
И приложите этот rar-архив сюда в тему как вложение. Под тест.


В перспективе, мысли "на мусор":
- unrar, как и остальные архиваторы, нужно тянуть из репозитория. В зависимостях у xarchiver его нет.
- Что если бы появился метапакет, скажем xarchiver-full, в котором зависимостями были бы и сам xarchiver и набор необходимых архиваторов, из того, чего ему не хватает.
- Нужно попросить Антона Мидюкова добавить unrar в профиль xfce-sysv. Судя по всему, это востребовано и у домашних пользователей и в организациях как базовая функциональность.
« Последнее редактирование: 02.02.2021 00:54:32 от Speccyfighter »

Оффлайн Koi

  • alt linux team
  • ***
  • Сообщений: 1 891
  • валар дохаэрис
    • Канал на youtube
Re: zip-архивы и кириллица
« Ответ #14 : 02.02.2021 12:33:03 »
Сделайте кто-нибудь в Windows тестовый архив RAR5 или что там. В кириллице. 1-2 мегабайта. Нужно для теста.
Scanning the drive for archives:
1 file, 2523420 bytes (2465 KiB)

Listing archive: Лев Толстой - Война и мир.rar

--
Path = Лев Толстой - Война и мир.rar
Type = Rar5
Physical Size = 2523420
Solid = -
Blocks = 1
Encrypted = -
Multivolume = -
Volumes = 1

   Date      Time    Attr         Size   Compressed  Name
------------------- ----- ------------ ------------  ------------------------
2021-02-02 10:45:50 ....A      2956402      2523183  Лев Толстой - Война и мир.pdf
------------------- ----- ------------ ------------  ------------------------
2021-02-02 10:45:50            2956402      2523183  1 files
Файл:
https://yadi.sk/d/ZcWk2_knYyD_vQ

Извиняюсь что так но...
Цитировать
Доступные типы файлов: doc, gif, jpg, mpg, mp4, pdf, png, txt, zip, odt, ods, odp, xls, ppt, gz, tar, bz2, ps, eps, rpm, tex, lyx, kturtle, diff, patch, log, po, ts, md5, sh, conf
Вложение rar выдает ошибку форума.  ;-D