Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
mein erster kernel panic - was tun?
View unanswered posts
View posts from last 24 hours
View posts from last 7 days

 
Reply to topic    Gentoo Forums Forum Index Deutsches Forum (German)
View previous topic :: View next topic  
Author Message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Sun Aug 11, 2024 4:19 pm    Post subject: mein erster kernel panic - was tun? Reply with quote

Neuerdings friert mein Rechner immer wieder ein. Auf einer anderen Konsole konnte ich diesen Fehler sehen:

Code:
Kernel panic -not syncing: corrupted stack end detected Insider scheduler
CPU: 2 PID: 0 Comm: swapper/2 Tainted: P B OE T 6.6.38-gentoo #1
Hardware name: Gigabyte [...]
Call Trace:
Kernel offset: disabled


Die Meldung muss ich auf dem Smartphone von einem Screenshot abtippen....

Selbst wenn ich von einer live-DVD starte bleibt er hängen. Kann das ein Hardware-Problem sein?

uhai
Back to top
View user's profile Send private message
Banana
Moderator
Moderator


Joined: 21 May 2004
Posts: 1752
Location: Germany

PostPosted: Sun Aug 11, 2024 4:59 pm    Post subject: Reply with quote

Prüfe mal was in dem Zeitraum passiert sein könnte

  • Installierte packages
  • Hardware anpassungen
  • BIOS
  • Temperatur


Mein verdacht ist, Temperatur. Ist ja warm die Tage. Ne simple Übersicht kannste mit https://wiki.gentoo.org/wiki/Lm_sensors oder auch im BIOS bekommen.
_________________
Forum Guidelines

PFL - Portage file list - find which package a file or command belongs to.
My delta-labs.org snippets do expire
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Sun Aug 11, 2024 6:58 pm    Post subject: Reply with quote

Ist ein kleiner Tower, 3 Ventilatoren verbaut, Seitenteile abgebaut. Temperatur - vielleicht.

Hardware und BIOS habe ich nichts geändert. Sonst nur Updates mit Emergenz - auDNtv world.... auch kein neuer Kernel...

Ob lmsensors dort.zum laufen.bekomme, weiß ich nicht. Nach gefühlt 3-5 Minuten ist das Ding eingefroren.
Back to top
View user's profile Send private message
platinumviper
l33t
l33t


Joined: 12 Feb 2004
Posts: 658
Location: Munich, Germany

PostPosted: Mon Aug 12, 2024 12:51 am    Post subject: Reply with quote

Bei mir compiliert lm-sensors in ca. 8 Sekunden.
Die Gehäuselüfter sind nicht so wichtig, wahrscheinlich überhitzt die CPU.
Falls es an einer CPU-Überhitzung liegt, kannst du beim Booten die Zahl der benutzten CPUs reduzieren, indem du z.B. maxcpus=2 als Kernel-Parameter angibst, dann sollte es erheblich länger dauern bis dein digitaler Abakus abstürzt.
Es kann auch am Speicher liegen, installier mal sys-apps/memtest86+ (dauert auch nur wenige Sekunden) und trage es in deinen Bootloader ein. Hast du mal auf die Speichermodule gesehen? Ich hatte mal das Problem, dass der Luftkühler der CPU auf die Module pustete, dort sammelte sich im Laufe der Zeit Staub an, der offenbar ein wenig leitete und zu Abstützen durch Speicherfehler führte. Ein Staubsauger hat das Problem beseitigt.
Viel Erfolg!
_________________
No money back garantee. In case of problems, don't call us, we call you.
Back to top
View user's profile Send private message
Erdie
Advocate
Advocate


Joined: 20 May 2004
Posts: 2650
Location: Heidelberg - Germany

PostPosted: Mon Aug 12, 2024 6:54 am    Post subject: Reply with quote

Wenn es auch mit einer Live CD passiert, kann es ja kaum an der Software liegen. Ich würde mal einen RAM Test machen.
_________________
Desktop AMD Ryzen 9 5900X 32GB RAM, Asus GF GTX 1060.
Notebook Tuxedo Pulse 15 Gen1 AMD Ryzen 7 4800H mit Radeon Vega 7
Raspberry Pi 1 + 2 + 3B+ + Zero W
Back to top
View user's profile Send private message
Banana
Moderator
Moderator


Joined: 21 May 2004
Posts: 1752
Location: Germany

PostPosted: Mon Aug 12, 2024 3:57 pm    Post subject: Reply with quote

Also ich sach mal so: Wenn deine Herkunfstangabe stimmt, dann ist es heute warm. Sehr warm. Wenn das Dinge heute öfters abschmiert bzw. kürzer durchhält, dann ist die Sache schon mal eingekreist.
Gegenprobe haste ja, denn es soll ja ein wenig kühler werden.
_________________
Forum Guidelines

PFL - Portage file list - find which package a file or command belongs to.
My delta-labs.org snippets do expire
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Mon Aug 12, 2024 4:58 pm    Post subject: Reply with quote

Erdie wrote:
Wenn es auch mit einer Live CD passiert, kann es ja kaum an der Software liegen. Ich würde mal einen RAM Test machen.

Nach dem chroot beim Versuch, die.Plattenbelegung zu prüfen und.den Kernel nochmal zu bauen...

Morgen probiere ich lmsensors zu installieren, da habe ich Zeit.
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Fri Aug 16, 2024 6:24 am    Post subject: Reply with quote

Zwischenstand:
ist alles kompliziert hier.... memtest86-bin ist installiert, wird aber nicht aufgerufen. Beim booten wechsle ich mit F12 ins boot-Menü vom BIOS, starte memtest und lande in grub.... ohne Eintrag für memtest.

lm-sensors hbe ich installiert, zeigt Temperaturen von - °C beim Rechnerstart an. Im Bios werden mir 55-60°C angezeigt.... dort habe ich jetzt mal die Warnungen aktiviert.

Anscheinend habe ich hier irgendwann einen Fehler beim Kernelupdate gemacht (oder irgendwann anders...). Ich vermute, hier ist die Boot-Konfiguration versaut. Grub, efi, evtl. auch systemd-boot - aktuell würde ich den part einfach neu aufsetzen und dann mal probiere, ob das System wieder stabil ist.

Gibt es Empfehlungen für amd64 mit systemd "how to boot best"? Vermutlich dürfte systemd-boot in der Konstellation sinnvoll sein, oder?

uhai
Back to top
View user's profile Send private message
firefly
Watchman
Watchman


Joined: 31 Oct 2002
Posts: 5320

PostPosted: Fri Aug 16, 2024 7:11 am    Post subject: Reply with quote

uhai wrote:
Zwischenstand:
ist alles kompliziert hier.... memtest86-bin ist installiert, wird aber nicht aufgerufen. Beim booten wechsle ich mit F12 ins boot-Menü vom BIOS, starte memtest und lande in grub.... ohne Eintrag für memtest.

lm-sensors hbe ich installiert, zeigt Temperaturen von - °C beim Rechnerstart an. Im Bios werden mir 55-60°C angezeigt.... dort habe ich jetzt mal die Warnungen aktiviert.

Anscheinend habe ich hier irgendwann einen Fehler beim Kernelupdate gemacht (oder irgendwann anders...). Ich vermute, hier ist die Boot-Konfiguration versaut. Grub, efi, evtl. auch systemd-boot - aktuell würde ich den part einfach neu aufsetzen und dann mal probiere, ob das System wieder stabil ist.

Gibt es Empfehlungen für amd64 mit systemd "how to boot best"? Vermutlich dürfte systemd-boot in der Konstellation sinnvoll sein, oder?

uhai


die reine installation von lm-sensors liefert noch gar nichts. Das paket muss erst noch konfiguriert werden.
Das geht unter anderem via sensors-detect.
Das tool versucht die im system eventuell vorhandenen sensor chips zu finden.
Anzumerken ist, dass dann für die entsprechenden sensor chips auch im kernel die entsprechenden treiber (fest oder als modul) aktiv sein müssen.
Bezüglich memtest. Was hast du nach der installtion des paket genau gemacht? Denn AFAIK wird durch die installation nicht unbedingt automatisch ein eintrag im bootloader/uefi gemacht.
Bzw. kann der eintrag fehlerhaft sein, je nachdem ob bei der installation z.b. die efi partition überhaupt gemountet war.
Du lieferst mal wieder zu wenig Informationen was du überhaupt genau gemacht hast.

Und ich denke nicht, dass die boot konfiguration bei dir komplett versaut ist. Aber aufgrund mangelnder Informationen kann man das nicht beurteilen.
Alternativ kannst du auch via livecd (bzw. via usb-stick) memtest laufen lassen
z.b. hat die livecd version von gparted memtest mit dabei: https://gparted.org/liveusb.php
Oder auch systemrescue https://www.system-rescue.org/Installing-SystemRescue-on-a-USB-memory-stick/

Edit: Hab mit mal das ebuild von sys-apps/memtest86-bin angeschaut.
Dort wird bei der installation, soweit ich das verstehe, das efi image von memtest nach /boot als memtest86-bin.efi installiert.
Und zusätzlich wird für grub unter /etc/grub.d eine datei angelegt.
Nur wird dann nicht die grub konfiguration automatisch neu erzeugt. Da muss man schon selbst machen.
_________________
Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn.
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Fri Aug 16, 2024 5:31 pm    Post subject: Reply with quote

lm-sensors habe ich nach wiki installiert. Da es vorher um den Verdacht der Überhitzung ging, ist für mich die Temperaturanzeige ausreichend und die habe ich. Ich fand nur interessant, das das BIOS andere Werte anzeigt....

memtest86-bin habe ich vor ein paar Jahren installiert um ein defektes Speichermodul zu finden. Den Speicher habe ich damals ausgetauscht. Memtest hat sich damals über das Bootmenü vom BIOS von der EFI-Partition starten lassen. Das funktioniert jetzt nicht mehr, ich lande bei Grub. Für die Installation habe ich damals auch etwas gebraucht, aber es lief dann. Wie ich installiert habe, weiss ich heute.nicht mehr.
Jedenfalls ist das nicht normal dass der Memtest-Eintrag im BIOS-Bootmenü auf Grub deutet. Deshalb vermute ich ein Boot-Problem.
Back to top
View user's profile Send private message
l3u
Advocate
Advocate


Joined: 26 Jan 2005
Posts: 2610
Location: Konradsreuth (Germany)

PostPosted: Sat Aug 17, 2024 7:20 am    Post subject: Reply with quote

Den Memtest gibt's doch auch als Live-CD bzw. -ISO-Image, wo man nen bootbaren USB-Stick draus machen kann. Probier doch mal das! Notfalls mit nem anderen Rechner den Stick erstellen.

Kaputter RAM macht die komischsten Probleme … lange Jahre hatte ich da nie was damit zu tun, aber irgendwann hat es mich dann auch getroffen. Da kommt man erstmal nicht dahinter, weil einfach ganz, ganz merkwürdige Sachen passieren. Ich würde an deiner Stelle als Allerallererstes den Arbeitsspeicher checken!

Ich hab kürzlich sys-apps/memtest86-bin installiert, das steht „ganz normal“ als Eintrag im Grub-Menü und lässt sich auch darüber starten …
Back to top
View user's profile Send private message
firefly
Watchman
Watchman


Joined: 31 Oct 2002
Posts: 5320

PostPosted: Sat Aug 17, 2024 7:33 am    Post subject: Reply with quote

l3u wrote:

Ich hab kürzlich sys-apps/memtest86-bin installiert, das steht „ganz normal“ als Eintrag im Grub-Menü und lässt sich auch darüber starten …

Vermutlich aber auch nur weil du im anschluss ein grub-mkconfig ausgeführt hast oder?
Denn laut dem ebuild passiert das nicht automatisch.
_________________
Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn.
Back to top
View user's profile Send private message
l3u
Advocate
Advocate


Joined: 26 Jan 2005
Posts: 2610
Location: Konradsreuth (Germany)

PostPosted: Sat Aug 17, 2024 8:10 am    Post subject: Reply with quote

Kann sein …
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Sun Aug 18, 2024 11:28 am    Post subject: Reply with quote

So, memtest ist durch ohne Fehler. Test in Standardeinstellung, seit gestern 13:00 Uhr bis irgendwann heute Nacht. Lief durch, bin uüberrascht.
Der erste Versuch mit allen Tests scharf geschälten ist bei 8% eingefroren....?

Ich habe auf /Boot/grub die grub.cfg nachbearbeitet, dann ging es.

Beim Start meines Systems kommt als erstes die Fehlermeldung „keine EFI-Partition gefunden“. Starten tut er trotzdem. Ich habe auf der Platte /boot/EFI und /EFI. Da sollte ich auf alle Fälle mal danach sehen. Irgendwas ist da wohl falsch.

Gibt es beim kernel panic eigentlich ein log? Ich habe das nur einmal auf.einer Konsole gesehen....
Back to top
View user's profile Send private message
schmidicom
Veteran
Veteran


Joined: 09 Mar 2006
Posts: 1972
Location: Schweiz

PostPosted: Sun Aug 18, 2024 6:27 pm    Post subject: Reply with quote

uhai wrote:
Gibt es beim kernel panic eigentlich ein log? Ich habe das nur einmal auf.einer Konsole gesehen....

Es gäbe da den PSTORE aber wirklich benutzt habe ich den noch nie. Trotzdem hier mal ein Link zu dem Thema:
https://www.ais.com/understanding-pstore-linux-kernel-persistent-storage-file-system/
_________________
Lenovo - ThinkPad P16s Gen 2 - 21K9CTO1WW
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Mon Aug 19, 2024 4:41 pm    Post subject: Reply with quote

Danke, dass schau ich mir an.

Ich habe noch ein bisschen mit memtest herumgespielt und folgendes beobachtet:
Setze ich in memetest bei CPU Roundup Robin ein, läuft der Test bis ca. 8 oder 9% und friert dann ein.
Stelle ich auf alle cpus um, bricht memtest direkt nach dem Start wegen zuvielen Fehlern (>10.000) ab.

Lasse ich es mal mit allen CPUs laufen, friert er bei 16% ein.

Möglicherweise ist einer der 8 CPUs defekt?
Sollte ich memtest mit jeder CPU mal einzeln laufen lassen?
Back to top
View user's profile Send private message
Christian99
Veteran
Veteran


Joined: 28 May 2009
Posts: 1713

PostPosted: Wed Aug 21, 2024 9:31 am    Post subject: Reply with quote

was für eine CPU hast du denn? vielleicht hat es etwas damit zu tun: https://www.connect.de/news/intel-13-14-probleme-stabilitaet-amd-alternative-3206195.html
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Thu Aug 22, 2024 9:34 am    Post subject: Reply with quote

gas ist win fx 8350 von amd....
Back to top
View user's profile Send private message
Christian99
Veteran
Veteran


Joined: 28 May 2009
Posts: 1713

PostPosted: Thu Aug 22, 2024 12:29 pm    Post subject: Reply with quote

dann ist es vermutlich etwas anderes :)
Back to top
View user's profile Send private message
firefly
Watchman
Watchman


Joined: 31 Oct 2002
Posts: 5320

PostPosted: Thu Aug 22, 2024 2:43 pm    Post subject: Reply with quote

Da diese CPU vermutlich was 12 Jahre alt ist (release vom 23. Oktober 2012), würde ich einen defekt der CPU/Mainboard aufgrund von Alterung vermuten.
_________________
Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn.
Back to top
View user's profile Send private message
Erdie
Advocate
Advocate


Joined: 20 May 2004
Posts: 2650
Location: Heidelberg - Germany

PostPosted: Thu Aug 22, 2024 6:33 pm    Post subject: Reply with quote

So ganz nebenbei, meine letzte CPU war auch ein FX85<irgendwas> und der hat tatsächlich irgendwann die Tendenz gehabt, ständig abzustürzen. In erster Linie waren das System - Freezes. Ich habe mir einen Wolf nach dem Fehler gesucht. Nur der neue Ryzen hat dann die Stabiliät zurückgebracht. Ich habe den Eindruck, dass die FX - Serie von AMD nicht das gelbe vom Ei gewesen ist.

Daher halte ich die Hardware - These für sehr wahrscheinlich. Tipp: Wenn Du ein Hardware Upgrade auch Ryzen machst, wirst Du Dein System erst neu bauen müssen, denn der Ryzen ist zu dem FX nicht abwärtskompatibel. Es fehlt ein CPU flag. Das gilt allerdings nur, wenn Du jetzt mit "NATIVE" gebaut hast. Sollte Dein aktuellen System nicht mehr in der Lage sein zu kompilieren, befürchte ich, dass Du neu installieren müßtest, denn der Ryzen wird das aktuelle System nicht booten.

Sollte Kompilieren noch möglich sein, erst ein -e world mit -k8 machen und dannach mit der neuen Hardware mit "native" optimieren.
_________________
Desktop AMD Ryzen 9 5900X 32GB RAM, Asus GF GTX 1060.
Notebook Tuxedo Pulse 15 Gen1 AMD Ryzen 7 4800H mit Radeon Vega 7
Raspberry Pi 1 + 2 + 3B+ + Zero W
Back to top
View user's profile Send private message
uhai
Veteran
Veteran


Joined: 23 Aug 2007
Posts: 1397
Location: Eppingen, Germany

PostPosted: Sat Aug 24, 2024 11:37 am    Post subject: Reply with quote

Danke Leute,

es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....

Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?

Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code]
Back to top
View user's profile Send private message
firefly
Watchman
Watchman


Joined: 31 Oct 2002
Posts: 5320

PostPosted: Sat Aug 24, 2024 2:28 pm    Post subject: Reply with quote

uhai wrote:
Danke Leute,

es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....

Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?

Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code]

Nope der FX ist AM3+.
Ryzen 1xxx bis 5xxx sind AM4 und die aktuellen Ryzen 7xxx bis 9xxx sind AM5
Und da scheinbar auch dein Mainboard hitzeprobleme hat, wäre es eh problematisch das mainboard weiter zu nutzen.
Da, wie du schon selbst vermutest, die Wahrscheinlichkeit groß ist, dass weitere Komponenten nach kurzer zeit Ausfallerscheinungen zeigen können.

Da wird dann auf jeden fall ein neues Board, CPU und RAM fällig.

AM4 benötigt DDR4 RAM. Und AM5 benötigt DDR5 RAM

Von dem was ich so über die aktuellste Generation, Ryzen 9xxx (welche dieses Jahr veröffentlicht wurde), so gelesen habe, ist diese Generation energy effizienter als die Vorgängergeneration 7xxx und liefert dabei bessere Performance als die Vorgängergeneration.
Quellen: https://www.phoronix.com/review/ryzen-9600x-9700x
https://www.phoronix.com/review/amd-ryzen-9950x-9900x

Es gibt "Aufrüstkits" (CPU, RAM, Mainboard) für den AM4 Sockel (Ryzen 5xxx und 4xxx, die 4xxx sind APUs mit integrierter GPU) ab ca. 200€ (Was lieferbar ist)
Quelle: https://www.arlt.com/Hardware/PC-Komponenten/Bundles/_Filter/Prozessor%2BHersteller/AMD/CPU-Sockel/AM4/

Für AM5 gibt es diese ab ca 400€: https://www.arlt.com/Hardware/PC-Komponenten/Bundles/_Filter/Prozessor%2BHersteller/AMD/CPU-Sockel/AM5/
die Ryzen 8xxx sind wie die Ryzen 4xxx APUs
_________________
Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn.
Back to top
View user's profile Send private message
ChrisJumper
Advocate
Advocate


Joined: 12 Mar 2005
Posts: 2400
Location: Germany

PostPosted: Wed Aug 28, 2024 8:37 pm    Post subject: Reply with quote

uhai wrote:
Danke Leute,

es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....

Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?

Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code]


Vielleicht auch noch mal die Kühlpaste tauschen! Aber ich denke es ist einfach günstig eine neue CPU anzuschaffen. Die brauchen ja uch viel weniger Strom und es gibt immer welche von 2023 die nicht so teuer sind. Die ganzen Cpu-Probleme der letzten Jahre ziehen sich eh durch, so das es fast keine Rolle spielt ob du Microcode ausrollen mußt und Mitigations per Firmware in Kauf nehmen.

Um einen Sockel-Wechsel kommst du halt nicht drum herum. Aber ich kenne es, bei mancher alter Hartware will man kein Upgrade riskiren weil spezielle veralterte Software drauf läuft und laufen muss.
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index Deutsches Forum (German) All times are GMT
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum