Skip to content

Wojciech Błaszkowski

  • Start
  • CQ-DX
  • Linux
  • O mnie
  • my Linux spell book
  • GitHub
  • RSS

xz vs. gzip – kompresja logów

2011-09-22 by Wojciech Błaszkowski

Katalog z logami zawiera ponad 100.000 plików średniej wielkości 40kB każdy. Po spakowaniu każdego z tych plików gzip’em, wielkość spakowanego katalogu wynosiła ~1,9GB (jak zeznało du).
Zrobiłem eksperyment. Każdy z plików rozpakowałem:

# find . -type f -name "*.gz" -exec gunzip -v {} \;

a następnie spakowałem xz:

# find . -type f -name "*.txt" -exec xz -v {} \;

Spakowane w ten sposób plilki zajmują 818MB. Odzyskałem połowę miejsca zużytego przez te pliki. Właśnie robię test z plikami ~60kB w stanie bez kompresji i zobaczymy jak wyjdzie. Oczywiście, zdaję sobie sprawę, że ~800MB to w dzisiejszych czasach przestrzeń która nie powala na kolana, ale jeśli liczyć więcej plików i przestrzenie w TB, to różnica będzie na prawdę zauważalna.

Dla logrotate wystarczy w /etc/logrotate.conf wpisać:

compresscmd /usr/bin/xz

i cieszyć się oszczędnością przestrzeni. Wadą xz jest jak na razie brak wielo-wątkowości, co jest niestety dość boleśnie odczuwalne :(

Post navigation

Previous Post:

mysql_connect z PHP 5.3.6 nie umie ::1

Next Post:

Cisco Linksys E1000 v2.1 i zarządzanie po SSL HTTP/0.9

3 Commments

  1. Wojtosz pisze:
    2011-09-22 o 13:39

    Inna maszyna. 364 plików z logami, przed kompresją: 2GB, po kompresji xz -9 : 80MB. Następnie rozpakowane i spakowane gzip -9 zajmują 105MB. Różnica niewielka, 1.3125 (jakieś 23,81%). Czas pakowania xz był kilkukrotnie większy niż w przypadku gzip’a.

    Te same ponad 100.000 plików po 40kB każdy (jak w pierwszym doświadczeniu) po rozpakowaniu zajmują 4,1GB. Każdy z nich zostanie spakowany xz -9 , jako że domyślny stopień kompresji dla xz (podobnie jak i dla gzip) to 6. Zajęte miejsce: 818M. Warto zatem korzystać z domyślnej wartości.

  2. Łukasz Jagiełło pisze:
    2011-09-22 o 21:08

    A jak z czasem kompresji ? bzip2 też pakuje lepiej niż gzip z default-a, ale czas jest nieporównywalnie dłuższy szczególnie przy gigabajtowych plikach (np. z logami).

  3. Wojtosz pisze:
    2011-09-23 o 06:48

    bzip2 będę męczył po weekendzie, teraz mam wyjazd na tapecie :) Jeśli chodzi o czas, to dobrze jest uwzględnić nie tylko czas pakowania, ale i czas rozpakowywania. Będę miał to na uwadze robiąc testy. xz o wiele bardziej się wlecze przy kompresji.

    Odnośnie gigabajtowych plików – nie byłoby Ci wygodniej rotować logi codziennie (daily)? Plików jest więcej, ale czas ich obsługi znacznie się skraca, szczególnie jak potrzebujesz wyłuskać kilka danych z konkretnej godziny danego dnia.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Wojciech Błaszkowski

Wojciech Błaszkowski

Cześć, jestem Wojciech.

Oprócz mojej codzienności nastawionej na bycie przygotowanym (prepper) znajdziesz tu kilka informacji jakie mogą przydać się administratorowi Linux, a także trochę prywatnych informacji o mnie którymi chciałbym się podzielić.

Zapraszam :)

Kto zabezpieczył Twój serwer?

Linux Admin

Co u mnie się dzieje:

  • W moim domu mówi się Walkiewiczem
  • Ferie 2023
  • Gwiazdka 2022
  • Antena W3DZZ
  • Zwalniamy :)

administracja serwerami linux

  • Administrator Linux Administrator Linux

Najnowsze komentarze

  • Ansible Create User With Sudo? All Answers - Brandiscrafts.com - Ansible – add user to sudo
  • Wojciech Błaszkowski - my linux spell book
  • virooz - Dostrajanie routera WiFi Netgear R7000
  • 123 - Ansible – add user to sudo
  • pauluZ - WRT160NL – router, którego używam w domu

Archiwa

  • kwiecień 2024
  • luty 2023
  • grudzień 2022
  • listopad 2020
  • lipiec 2020
  • marzec 2020
  • luty 2020
  • listopad 2019
  • lipiec 2019
  • maj 2019
  • wrzesień 2018
  • maj 2018
  • grudzień 2017
  • sierpień 2017
  • lipiec 2017
  • czerwiec 2017
  • luty 2017
  • grudzień 2016
  • wrzesień 2016
  • sierpień 2016
  • czerwiec 2016
  • marzec 2016
  • luty 2016
  • styczeń 2016
  • grudzień 2015
  • maj 2015
  • luty 2015
  • styczeń 2015
  • sierpień 2014
  • lipiec 2014
  • czerwiec 2014
  • maj 2014
  • styczeń 2014
  • grudzień 2013
  • listopad 2013
  • lipiec 2013
  • czerwiec 2013
  • maj 2013
  • marzec 2013
  • luty 2013
  • styczeń 2013
  • grudzień 2012
  • październik 2012
  • sierpień 2012
  • lipiec 2012
  • czerwiec 2012
  • kwiecień 2012
  • luty 2012
  • styczeń 2012
  • grudzień 2011
  • wrzesień 2011
  • sierpień 2011
  • maj 2011
  • marzec 2011
  • wrzesień 2010
  • maj 2010
  • kwiecień 2010
  • luty 2010
  • październik 2009
  • wrzesień 2009
  • sierpień 2009
  • lipiec 2009
  • luty 2009
  • grudzień 2008
  • październik 2008
  • wrzesień 2008
  • czerwiec 2008
  • kwiecień 2008
  • marzec 2008
  • luty 2008
  • grudzień 2007
  • październik 2007
  • wrzesień 2007
  • sierpień 2007
  • lipiec 2007
  • czerwiec 2007
  • maj 2007
  • kwiecień 2007
  • marzec 2007
  • luty 2007
  • styczeń 2007
  • grudzień 2006
  • listopad 2006
  • październik 2006
  • wrzesień 2006
  • sierpień 2006
  • lipiec 2006
  • czerwiec 2006
  • maj 2006
  • kwiecień 2006
  • marzec 2006
  • luty 2006

Administrator Linux

Jeśli szukasz opieki nad serwerem Linux, zapraszam do zapoznania się z tym czym zajmuję się na codzień. Administracja serwerami Linux
© 2025 Wojciech Błaszkowski | Built using WordPress and SuperbThemes