Автор Тема: Новое в дистрибутивах Восьмой платформы (Прочитано 86290 раз)

mlp451 · « **Ответ #225 :** 11.12.2014 21:16:05 »

В свопе конфиденциальной информации может оказаться даже больше, чем на разделах с ФС.

akarp · « **Ответ #226 :** 11.12.2014 22:45:08 »

Цитата: mlp451 от 11.12.2014 21:16:05

В свопе конфиденциальной информации может оказаться даже больше, чем на разделах с ФС.

Причем в открытом виде, в отличие от. Прямо дергай как есть и клади обратно в память.

shaba · « **Ответ #227 :** 17.12.2014 19:30:59 »

Всем привет.
что бы мне хотелось увидеть:
- bash4, нет никакого интереса адаптировать апстримные скрипты и комплишены на старый bash3
- миграция от prefdm к индивидуальным init-скриптам и unit-файлам *dm
- что-то для управления виртуальными машинами, уровня oVirt. (тут я пытаюсь собирать компоненты oVirt, но они сильно завязаны на RH).

потом еще что-нибудь вспомню.

kram78 · « **Ответ #228 :** 17.12.2014 20:31:23 »

Не плохо было бы увидеть пакет Samba-mounter

stanukih · « **Ответ #229 :** 19.12.2014 16:12:52 »

Хотелось бы увидить пятые кеды.

time · « **Ответ #230 :** 21.12.2014 11:24:35 »

В 2014 году все новые учебники в интернете представлены в формате .pdf, да ещё в таком, что в них не получается провести поиск по нужным словам и словосочетаниям. Возникает проблема перевода файлов .pdf в файлы .doc, Программ перевода под винду много. существуют сайты перевода, но они ограничивают объём обрабатываемого файла 33мб, а все учебники имеют больший объём. Что в плане перевода файлов из .pdf в .doc планируется в Восьмой платформе?

Skull · « **Ответ #231 :** 21.12.2014 14:50:40 »

LibreOffice

asy · « **Ответ #232 :** 21.12.2014 15:08:38 »

Цитата: time от 21.12.2014 11:24:35

В 2014 году все новые учебники в интернете представлены в формате .pdf, да ещё в таком, что в них не получается провести поиск по нужным словам и словосочетаниям. Возникает проблема перевода файлов .pdf в файлы .doc,

Если возникает проблема поиска, возможно, что там картинки внутри pdf. Это - непереводимо. Только через распознавалку. Может быть, yagf или cuneiform. Но до finereader им далековато пока. Adobe Reader тоже не ищет ?
http://www.altlinux.org/Adobe_Acrobat_Reader

time · « **Ответ #233 :** 21.12.2014 23:06:18 »

Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.

YYY · « **Ответ #234 :** 22.12.2014 00:20:28 »

Цитата: time от 21.12.2014 23:06:18

Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.

Если из pdf текст не копируется или копируется криво (скан там или еще что...)
Могу поделиться скриптом, но только текст :) Форматирование не вытащить...

надо установить djvused ddjvu gs cuneiform и tesseract

Код: [Выделить]

#!/bin/bash

#################################################################
#
#	ПАКЕТНАЯ РАСПОЗНАВАЛКА КНИЖЕК DJVU и PDF(картинки)
#
#	Использование:
#
#	book2txt.sh bookfile.djvu
#	book2txt.sh bookfile.pdf
#	
#	Результат будет в файле txt.txt
#	
#	Tребуются пакеты:
#	cuneiform
#	djvused
#	ddjvu
#	gs (Ghostscript)
#
#	Рекомендуется, но необязательно:
#	tesseract 
#	(используется если у cuneiform распознать страницу не вышло)
#
#################################################################

if [ "$1" == "" ]; then
	echo "Use:"
	echo "book2txt.sh bookfile.djvu   or   book2txt.sh bookfile.pdf"
	echo ""
	echo "(for work need cuneiform djvused ddjvu gs)"
	exit
fi

if [ -f $1 ]; then
	echo "File $1 exist... ok"
else
	echo "File $1 not found - exit"
	echo ""
	echo "END"
	exit
fi

echo "#############################################################################"
echo "try $1 to tif"
echo "#############################################################################"

# recognize file type

HE1=`head -c 20 $1 | grep -c "DJVM"`
HE2=`head -c 20 $1 | grep -c "PDF"`

if [ "$HE1" == "1" ]; then
	echo "find DJVU file!"

	dcount=`djvused $1 -e "n"`
	echo "page number $dcount"

	for j in `seq 1 $dcount`
	do
		dddcount="$j"
		if [ $j -lt 100 ]; then
			dddcount="0$dddcount"
		fi
		if [ $j -lt 10 ]; then
			dddcount="0$dddcount"
		fi
		echo "$dddcount"
		ddjvu -format=tiff -quality=100 -scale=300 -page=$j $1 img_$dddcount.tif
	done
	
else
	if [ "$HE2" == "1" ]; then
		echo "find PDF file!"
		#convert -density 300 $1 img_%04d.jpg
		gs -SDEVICE=tiffg4 -r350x350 -sPAPERSIZE=letter -sOutputFile=img_%04d.tif -dNOPAUSE -dBATCH -- $1		
	else
		echo "can't find file type!  It is not PDF or DJVU file"
		echo "END"
		exit
	fi
fi

echo "#############################################################################"
echo "ok"
echo "#############################################################################"


echo "---BEGIN---">txt.txt

z=0
FullERR=0
str=`ls -1 img_*`
count=`ls -1 img_* | wc -l`

for i in $str
do

z=`expr $z + 1`
echo "---------------------------------------------->try page $z from $count"
echo ""> tmp.txt

ERR=`cuneiform -l ruseng -o tmp.txt $i`
ERR2=`echo $?`
echo "[- $ERR -]|[- Exit status $ERR2 -]"
if [ "$ERR2" != "0" ]; then
	echo "error! - try one more!!!"
	ERR=`cuneiform -l ruseng -o tmp.txt $i`
	ERR2=`echo $?`
	echo "[- $ERR -]|[- Exit status $ERR2 -]"
	if [ "$ERR2" != "0" ]; then
		echo "error! - try one more-2!!!"
		ERR=`cuneiform -l ruseng -o tmp.txt $i`
		ERR2=`echo $?`
		echo "[- $ERR -]|[- Exit status $ERR2 -]"
		if [ "$ERR2" != "0" ]; then
			echo "error! - try one more-3!!!"
			ERR=`cuneiform -l ruseng -o tmp.txt $i`
			ERR2=`echo $?`
			echo "[- $ERR -]|[- Exit status $ERR2 -]"
			if [ "$ERR2" != "0" ]; then
				echo "error! - try tesseract !!!"
				ERR=`tesseract $i tmp -l rus`
				ERR2=`echo $?`
				if [ "$ERR2" != "0" ]; then
					echo "Can't recognize page $z ERROR! ERROR! ERROR! ERROR!"
					FullERR=`expr $FullERR + 1`
				fi
			fi
		fi 		
	fi 
fi 

cat tmp.txt >>txt.txt
echo "--- ^ PAGE $z ^ ---">>txt.txt

done

echo "---END---">>txt.txt
echo "Recognize $z from $count with $FullERR errors!"
echo "see txt.txt file"
echo "END"

asy · « **Ответ #235 :** 22.12.2014 00:27:16 »

Цитата: time от 21.12.2014 23:06:18

Да. Именно картинки внутри .pdf.

Тогда только через системы распознавания. Нормальная конвертация невозможна. Если только не устроит вытаскивание картинок из pdf и вставка их в doc. Но картинками они от этого быть не перестанут.

Skull · « **Ответ #236 :** 22.12.2014 00:33:09 »

Цитата: YYY от 22.12.2014 00:20:28

Цитата: time от 21.12.2014 23:06:18
Да. Именно картинки внутри .pdf. Акробат ещё не пробовал. Спасибо за подсказку.

Если из pdf текст не копируется или копируется криво (скан там или еще что...)
Могу поделиться скриптом, но только текст :) Форматирование не вытащить...

Cuneiform базовое форматирование (полужирный/курсив) вытаскивает.

Sim · « **Ответ #237 :** 22.12.2014 07:39:17 »

Только недавно заметил на р7: если поставить в холд пакет в синаптике, то если обновляться в консоле, то блокировка не применяется. Можно ли в восьмой платформе сделать так, чтобы hold в консоли работал так же в синаптике и наоборот?

dango · « **Ответ #238 :** 22.12.2014 09:17:47 »

Переношу свое предложение сюда.
Если в процессе обновления через Synaptic требуется удаление одного или нескольких пакетов, тогда выводить особое предупреждение об готовящихся изменениях. Как вариант, это может быть лишний запрос подтверждения с бошими красными буквами

Skull · « **Ответ #239 :** 22.12.2014 09:36:04 »

Патчи приветствуются.

Форум сообщества
Альт Линукс