Автор Тема: Новое в дистрибутивах Восьмой платформы  (Прочитано 86290 раз)

Оффлайн mlp451

  • Участник
  • *
  • Сообщений: 11
В свопе конфиденциальной информации может оказаться даже больше, чем на разделах с ФС.

Оффлайн akarp

  • Участник
  • *
  • Сообщений: 226
В свопе конфиденциальной информации может оказаться даже больше, чем на разделах с ФС.
Причем в открытом виде, в отличие от. Прямо дергай как есть и клади обратно в память.

Оффлайн shaba

  • alt linux team
  • ***
  • Сообщений: 6
Всем привет.
что бы мне хотелось увидеть:
- bash4, нет никакого интереса адаптировать апстримные скрипты и комплишены на старый bash3
- миграция от prefdm к индивидуальным init-скриптам и unit-файлам *dm
- что-то для управления виртуальными машинами, уровня oVirt. (тут я пытаюсь собирать компоненты oVirt, но они сильно завязаны на RH).

потом еще что-нибудь вспомню.

Оффлайн kram78

  • Участник
  • *
  • Сообщений: 24
Не плохо было бы увидеть пакет Samba-mounter

Оффлайн stanukih

  • Участник
  • *
  • Сообщений: 560
Хотелось бы увидить пятые кеды.

Оффлайн time

  • Участник
  • *
  • Сообщений: 231
В 2014 году все новые учебники в интернете представлены в формате .pdf, да ещё в таком, что в них не получается провести поиск по нужным словам и словосочетаниям. Возникает проблема перевода файлов .pdf в файлы .doc, Программ перевода под винду много. существуют сайты перевода, но они ограничивают объём обрабатываемого файла 33мб, а все учебники имеют больший объём. Что в плане перевода файлов из .pdf  в .doc планируется в Восьмой платформе?
INTEL PENTIUM G620 (2,6 GGZ),  MSI H611-E35(B3)   SDRAM 4GB DDR3     Philips 220VW9Fb/62

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 20 166
    • Домашняя страница
LibreOffice
Андрей Черепанов (cas@)

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 370
В 2014 году все новые учебники в интернете представлены в формате .pdf, да ещё в таком, что в них не получается провести поиск по нужным словам и словосочетаниям. Возникает проблема перевода файлов .pdf в файлы .doc,
Если возникает проблема поиска, возможно, что там картинки внутри pdf. Это - непереводимо. Только через распознавалку. Может быть, yagf или cuneiform. Но до finereader им далековато пока. Adobe Reader тоже не ищет ?
http://www.altlinux.org/Adobe_Acrobat_Reader

Оффлайн time

  • Участник
  • *
  • Сообщений: 231
Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.
INTEL PENTIUM G620 (2,6 GGZ),  MSI H611-E35(B3)   SDRAM 4GB DDR3     Philips 220VW9Fb/62

Оффлайн YYY

  • Мастер
  • ***
  • Сообщений: 6 046
Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.

Если из pdf текст не копируется или копируется криво (скан там или еще что...)
Могу поделиться скриптом, но только текст :) Форматирование не вытащить...

надо установить djvused ddjvu gs cuneiform и tesseract

#!/bin/bash

#################################################################
#
# ПАКЕТНАЯ РАСПОЗНАВАЛКА КНИЖЕК DJVU и PDF(картинки)
#
# Использование:
#
# book2txt.sh bookfile.djvu
# book2txt.sh bookfile.pdf
#
# Результат будет в файле txt.txt
#
# Tребуются пакеты:
# cuneiform
# djvused
# ddjvu
# gs (Ghostscript)
#
# Рекомендуется, но необязательно:
# tesseract
# (используется если у cuneiform распознать страницу не вышло)
#
#################################################################

if [ "$1" == "" ]; then
echo "Use:"
echo "book2txt.sh bookfile.djvu   or   book2txt.sh bookfile.pdf"
echo ""
echo "(for work need cuneiform djvused ddjvu gs)"
exit
fi

if [ -f $1 ]; then
echo "File $1 exist... ok"
else
echo "File $1 not found - exit"
echo ""
echo "END"
exit
fi

echo "#############################################################################"
echo "try $1 to tif"
echo "#############################################################################"

# recognize file type

HE1=`head -c 20 $1 | grep -c "DJVM"`
HE2=`head -c 20 $1 | grep -c "PDF"`

if [ "$HE1" == "1" ]; then
echo "find DJVU file!"

dcount=`djvused $1 -e "n"`
echo "page number $dcount"

for j in `seq 1 $dcount`
do
dddcount="$j"
if [ $j -lt 100 ]; then
dddcount="0$dddcount"
fi
if [ $j -lt 10 ]; then
dddcount="0$dddcount"
fi
echo "$dddcount"
ddjvu -format=tiff -quality=100 -scale=300 -page=$j $1 img_$dddcount.tif
done

else
if [ "$HE2" == "1" ]; then
echo "find PDF file!"
#convert -density 300 $1 img_%04d.jpg
gs -SDEVICE=tiffg4 -r350x350 -sPAPERSIZE=letter -sOutputFile=img_%04d.tif -dNOPAUSE -dBATCH -- $1
else
echo "can't find file type!  It is not PDF or DJVU file"
echo "END"
exit
fi
fi

echo "#############################################################################"
echo "ok"
echo "#############################################################################"


echo "---BEGIN---">txt.txt

z=0
FullERR=0
str=`ls -1 img_*`
count=`ls -1 img_* | wc -l`

for i in $str
do

z=`expr $z + 1`
echo "---------------------------------------------->try page $z from $count"
echo ""> tmp.txt

ERR=`cuneiform -l ruseng -o tmp.txt $i`
ERR2=`echo $?`
echo "[- $ERR -]|[- Exit status $ERR2 -]"
if [ "$ERR2" != "0" ]; then
echo "error! - try one more!!!"
ERR=`cuneiform -l ruseng -o tmp.txt $i`
ERR2=`echo $?`
echo "[- $ERR -]|[- Exit status $ERR2 -]"
if [ "$ERR2" != "0" ]; then
echo "error! - try one more-2!!!"
ERR=`cuneiform -l ruseng -o tmp.txt $i`
ERR2=`echo $?`
echo "[- $ERR -]|[- Exit status $ERR2 -]"
if [ "$ERR2" != "0" ]; then
echo "error! - try one more-3!!!"
ERR=`cuneiform -l ruseng -o tmp.txt $i`
ERR2=`echo $?`
echo "[- $ERR -]|[- Exit status $ERR2 -]"
if [ "$ERR2" != "0" ]; then
echo "error! - try tesseract !!!"
ERR=`tesseract $i tmp -l rus`
ERR2=`echo $?`
if [ "$ERR2" != "0" ]; then
echo "Can't recognize page $z ERROR! ERROR! ERROR! ERROR!"
FullERR=`expr $FullERR + 1`
fi
fi
fi
fi
fi

cat tmp.txt >>txt.txt
echo "--- ^ PAGE $z ^ ---">>txt.txt

done

echo "---END---">>txt.txt
echo "Recognize $z from $count with $FullERR errors!"
echo "see txt.txt file"
echo "END"

« Последнее редактирование: 22.12.2014 00:23:08 от YYY »

Оффлайн asy

  • alt linux team
  • ***
  • Сообщений: 8 370
Да. Именно картинки внутри .pdf.
Тогда только через системы распознавания. Нормальная конвертация невозможна. Если только не устроит вытаскивание картинок из pdf и вставка их в doc. Но картинками они от этого быть не перестанут.

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 20 166
    • Домашняя страница
Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.

Если из pdf текст не копируется или копируется криво (скан там или еще что...)
Могу поделиться скриптом, но только текст :) Форматирование не вытащить...
Cuneiform базовое форматирование (полужирный/курсив) вытаскивает.
Андрей Черепанов (cas@)

Sim

  • Гость
Только недавно заметил на р7: если поставить в холд пакет в синаптике, то если обновляться в консоле, то блокировка не применяется. Можно ли в восьмой платформе сделать так, чтобы hold в консоли работал так же в синаптике и наоборот?

dango

  • Гость
Переношу свое предложение сюда.
Если в процессе обновления через Synaptic требуется удаление одного или нескольких пакетов, тогда выводить особое предупреждение об готовящихся изменениях. Как вариант, это может быть лишний запрос подтверждения с бошими красными буквами :-)

Оффлайн Skull

  • Глобальный модератор
  • *****
  • Сообщений: 20 166
    • Домашняя страница
Патчи приветствуются.
Андрей Черепанов (cas@)