View previous topic :: View next topic |
Author |
Message |
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Sun Aug 11, 2024 4:19 pm Post subject: mein erster kernel panic - was tun? |
|
|
Neuerdings friert mein Rechner immer wieder ein. Auf einer anderen Konsole konnte ich diesen Fehler sehen:
Code: | Kernel panic -not syncing: corrupted stack end detected Insider scheduler
CPU: 2 PID: 0 Comm: swapper/2 Tainted: P B OE T 6.6.38-gentoo #1
Hardware name: Gigabyte [...]
Call Trace:
Kernel offset: disabled |
Die Meldung muss ich auf dem Smartphone von einem Screenshot abtippen....
Selbst wenn ich von einer live-DVD starte bleibt er hängen. Kann das ein Hardware-Problem sein?
uhai |
|
Back to top |
|
|
Banana Moderator
Joined: 21 May 2004 Posts: 1802 Location: Germany
|
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Sun Aug 11, 2024 6:58 pm Post subject: |
|
|
Ist ein kleiner Tower, 3 Ventilatoren verbaut, Seitenteile abgebaut. Temperatur - vielleicht.
Hardware und BIOS habe ich nichts geändert. Sonst nur Updates mit Emergenz - auDNtv world.... auch kein neuer Kernel...
Ob lmsensors dort.zum laufen.bekomme, weiß ich nicht. Nach gefühlt 3-5 Minuten ist das Ding eingefroren. |
|
Back to top |
|
|
platinumviper l33t
Joined: 12 Feb 2004 Posts: 658 Location: Munich, Germany
|
Posted: Mon Aug 12, 2024 12:51 am Post subject: |
|
|
Bei mir compiliert lm-sensors in ca. 8 Sekunden.
Die Gehäuselüfter sind nicht so wichtig, wahrscheinlich überhitzt die CPU.
Falls es an einer CPU-Überhitzung liegt, kannst du beim Booten die Zahl der benutzten CPUs reduzieren, indem du z.B. maxcpus=2 als Kernel-Parameter angibst, dann sollte es erheblich länger dauern bis dein digitaler Abakus abstürzt.
Es kann auch am Speicher liegen, installier mal sys-apps/memtest86+ (dauert auch nur wenige Sekunden) und trage es in deinen Bootloader ein. Hast du mal auf die Speichermodule gesehen? Ich hatte mal das Problem, dass der Luftkühler der CPU auf die Module pustete, dort sammelte sich im Laufe der Zeit Staub an, der offenbar ein wenig leitete und zu Abstützen durch Speicherfehler führte. Ein Staubsauger hat das Problem beseitigt.
Viel Erfolg! _________________ No money back garantee. In case of problems, don't call us, we call you. |
|
Back to top |
|
|
Erdie Advocate
Joined: 20 May 2004 Posts: 2654 Location: Heidelberg - Germany
|
Posted: Mon Aug 12, 2024 6:54 am Post subject: |
|
|
Wenn es auch mit einer Live CD passiert, kann es ja kaum an der Software liegen. Ich würde mal einen RAM Test machen. _________________ Desktop AMD Ryzen 9 5900X 32GB RAM, Asus GF GTX 1060.
Notebook Tuxedo Pulse 15 Gen1 AMD Ryzen 7 4800H mit Radeon Vega 7
Raspberry Pi 1 + 2 + 3B+ + Zero W |
|
Back to top |
|
|
Banana Moderator
Joined: 21 May 2004 Posts: 1802 Location: Germany
|
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Mon Aug 12, 2024 4:58 pm Post subject: |
|
|
Erdie wrote: | Wenn es auch mit einer Live CD passiert, kann es ja kaum an der Software liegen. Ich würde mal einen RAM Test machen. |
Nach dem chroot beim Versuch, die.Plattenbelegung zu prüfen und.den Kernel nochmal zu bauen...
Morgen probiere ich lmsensors zu installieren, da habe ich Zeit. |
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Fri Aug 16, 2024 6:24 am Post subject: |
|
|
Zwischenstand:
ist alles kompliziert hier.... memtest86-bin ist installiert, wird aber nicht aufgerufen. Beim booten wechsle ich mit F12 ins boot-Menü vom BIOS, starte memtest und lande in grub.... ohne Eintrag für memtest.
lm-sensors hbe ich installiert, zeigt Temperaturen von - °C beim Rechnerstart an. Im Bios werden mir 55-60°C angezeigt.... dort habe ich jetzt mal die Warnungen aktiviert.
Anscheinend habe ich hier irgendwann einen Fehler beim Kernelupdate gemacht (oder irgendwann anders...). Ich vermute, hier ist die Boot-Konfiguration versaut. Grub, efi, evtl. auch systemd-boot - aktuell würde ich den part einfach neu aufsetzen und dann mal probiere, ob das System wieder stabil ist.
Gibt es Empfehlungen für amd64 mit systemd "how to boot best"? Vermutlich dürfte systemd-boot in der Konstellation sinnvoll sein, oder?
uhai |
|
Back to top |
|
|
firefly Watchman
Joined: 31 Oct 2002 Posts: 5327
|
Posted: Fri Aug 16, 2024 7:11 am Post subject: |
|
|
uhai wrote: | Zwischenstand:
ist alles kompliziert hier.... memtest86-bin ist installiert, wird aber nicht aufgerufen. Beim booten wechsle ich mit F12 ins boot-Menü vom BIOS, starte memtest und lande in grub.... ohne Eintrag für memtest.
lm-sensors hbe ich installiert, zeigt Temperaturen von - °C beim Rechnerstart an. Im Bios werden mir 55-60°C angezeigt.... dort habe ich jetzt mal die Warnungen aktiviert.
Anscheinend habe ich hier irgendwann einen Fehler beim Kernelupdate gemacht (oder irgendwann anders...). Ich vermute, hier ist die Boot-Konfiguration versaut. Grub, efi, evtl. auch systemd-boot - aktuell würde ich den part einfach neu aufsetzen und dann mal probiere, ob das System wieder stabil ist.
Gibt es Empfehlungen für amd64 mit systemd "how to boot best"? Vermutlich dürfte systemd-boot in der Konstellation sinnvoll sein, oder?
uhai |
die reine installation von lm-sensors liefert noch gar nichts. Das paket muss erst noch konfiguriert werden.
Das geht unter anderem via sensors-detect.
Das tool versucht die im system eventuell vorhandenen sensor chips zu finden.
Anzumerken ist, dass dann für die entsprechenden sensor chips auch im kernel die entsprechenden treiber (fest oder als modul) aktiv sein müssen.
Bezüglich memtest. Was hast du nach der installtion des paket genau gemacht? Denn AFAIK wird durch die installation nicht unbedingt automatisch ein eintrag im bootloader/uefi gemacht.
Bzw. kann der eintrag fehlerhaft sein, je nachdem ob bei der installation z.b. die efi partition überhaupt gemountet war.
Du lieferst mal wieder zu wenig Informationen was du überhaupt genau gemacht hast.
Und ich denke nicht, dass die boot konfiguration bei dir komplett versaut ist. Aber aufgrund mangelnder Informationen kann man das nicht beurteilen.
Alternativ kannst du auch via livecd (bzw. via usb-stick) memtest laufen lassen
z.b. hat die livecd version von gparted memtest mit dabei: https://gparted.org/liveusb.php
Oder auch systemrescue https://www.system-rescue.org/Installing-SystemRescue-on-a-USB-memory-stick/
Edit: Hab mit mal das ebuild von sys-apps/memtest86-bin angeschaut.
Dort wird bei der installation, soweit ich das verstehe, das efi image von memtest nach /boot als memtest86-bin.efi installiert.
Und zusätzlich wird für grub unter /etc/grub.d eine datei angelegt.
Nur wird dann nicht die grub konfiguration automatisch neu erzeugt. Da muss man schon selbst machen. _________________ Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn. |
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Fri Aug 16, 2024 5:31 pm Post subject: |
|
|
lm-sensors habe ich nach wiki installiert. Da es vorher um den Verdacht der Überhitzung ging, ist für mich die Temperaturanzeige ausreichend und die habe ich. Ich fand nur interessant, das das BIOS andere Werte anzeigt....
memtest86-bin habe ich vor ein paar Jahren installiert um ein defektes Speichermodul zu finden. Den Speicher habe ich damals ausgetauscht. Memtest hat sich damals über das Bootmenü vom BIOS von der EFI-Partition starten lassen. Das funktioniert jetzt nicht mehr, ich lande bei Grub. Für die Installation habe ich damals auch etwas gebraucht, aber es lief dann. Wie ich installiert habe, weiss ich heute.nicht mehr.
Jedenfalls ist das nicht normal dass der Memtest-Eintrag im BIOS-Bootmenü auf Grub deutet. Deshalb vermute ich ein Boot-Problem. |
|
Back to top |
|
|
l3u Advocate
Joined: 26 Jan 2005 Posts: 2616 Location: Konradsreuth (Germany)
|
Posted: Sat Aug 17, 2024 7:20 am Post subject: |
|
|
Den Memtest gibt's doch auch als Live-CD bzw. -ISO-Image, wo man nen bootbaren USB-Stick draus machen kann. Probier doch mal das! Notfalls mit nem anderen Rechner den Stick erstellen.
Kaputter RAM macht die komischsten Probleme … lange Jahre hatte ich da nie was damit zu tun, aber irgendwann hat es mich dann auch getroffen. Da kommt man erstmal nicht dahinter, weil einfach ganz, ganz merkwürdige Sachen passieren. Ich würde an deiner Stelle als Allerallererstes den Arbeitsspeicher checken!
Ich hab kürzlich sys-apps/memtest86-bin installiert, das steht „ganz normal“ als Eintrag im Grub-Menü und lässt sich auch darüber starten … |
|
Back to top |
|
|
firefly Watchman
Joined: 31 Oct 2002 Posts: 5327
|
Posted: Sat Aug 17, 2024 7:33 am Post subject: |
|
|
l3u wrote: |
Ich hab kürzlich sys-apps/memtest86-bin installiert, das steht „ganz normal“ als Eintrag im Grub-Menü und lässt sich auch darüber starten … |
Vermutlich aber auch nur weil du im anschluss ein grub-mkconfig ausgeführt hast oder?
Denn laut dem ebuild passiert das nicht automatisch. _________________ Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn. |
|
Back to top |
|
|
l3u Advocate
Joined: 26 Jan 2005 Posts: 2616 Location: Konradsreuth (Germany)
|
Posted: Sat Aug 17, 2024 8:10 am Post subject: |
|
|
Kann sein … |
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Sun Aug 18, 2024 11:28 am Post subject: |
|
|
So, memtest ist durch ohne Fehler. Test in Standardeinstellung, seit gestern 13:00 Uhr bis irgendwann heute Nacht. Lief durch, bin uüberrascht.
Der erste Versuch mit allen Tests scharf geschälten ist bei 8% eingefroren....?
Ich habe auf /Boot/grub die grub.cfg nachbearbeitet, dann ging es.
Beim Start meines Systems kommt als erstes die Fehlermeldung „keine EFI-Partition gefunden“. Starten tut er trotzdem. Ich habe auf der Platte /boot/EFI und /EFI. Da sollte ich auf alle Fälle mal danach sehen. Irgendwas ist da wohl falsch.
Gibt es beim kernel panic eigentlich ein log? Ich habe das nur einmal auf.einer Konsole gesehen.... |
|
Back to top |
|
|
schmidicom Veteran
Joined: 09 Mar 2006 Posts: 1975 Location: Schweiz
|
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Mon Aug 19, 2024 4:41 pm Post subject: |
|
|
Danke, dass schau ich mir an.
Ich habe noch ein bisschen mit memtest herumgespielt und folgendes beobachtet:
Setze ich in memetest bei CPU Roundup Robin ein, läuft der Test bis ca. 8 oder 9% und friert dann ein.
Stelle ich auf alle cpus um, bricht memtest direkt nach dem Start wegen zuvielen Fehlern (>10.000) ab.
Lasse ich es mal mit allen CPUs laufen, friert er bei 16% ein.
Möglicherweise ist einer der 8 CPUs defekt?
Sollte ich memtest mit jeder CPU mal einzeln laufen lassen? |
|
Back to top |
|
|
Christian99 Veteran
Joined: 28 May 2009 Posts: 1715
|
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Thu Aug 22, 2024 9:34 am Post subject: |
|
|
gas ist win fx 8350 von amd.... |
|
Back to top |
|
|
Christian99 Veteran
Joined: 28 May 2009 Posts: 1715
|
Posted: Thu Aug 22, 2024 12:29 pm Post subject: |
|
|
dann ist es vermutlich etwas anderes |
|
Back to top |
|
|
firefly Watchman
Joined: 31 Oct 2002 Posts: 5327
|
Posted: Thu Aug 22, 2024 2:43 pm Post subject: |
|
|
Da diese CPU vermutlich was 12 Jahre alt ist (release vom 23. Oktober 2012), würde ich einen defekt der CPU/Mainboard aufgrund von Alterung vermuten. _________________ Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn. |
|
Back to top |
|
|
Erdie Advocate
Joined: 20 May 2004 Posts: 2654 Location: Heidelberg - Germany
|
Posted: Thu Aug 22, 2024 6:33 pm Post subject: |
|
|
So ganz nebenbei, meine letzte CPU war auch ein FX85<irgendwas> und der hat tatsächlich irgendwann die Tendenz gehabt, ständig abzustürzen. In erster Linie waren das System - Freezes. Ich habe mir einen Wolf nach dem Fehler gesucht. Nur der neue Ryzen hat dann die Stabiliät zurückgebracht. Ich habe den Eindruck, dass die FX - Serie von AMD nicht das gelbe vom Ei gewesen ist.
Daher halte ich die Hardware - These für sehr wahrscheinlich. Tipp: Wenn Du ein Hardware Upgrade auch Ryzen machst, wirst Du Dein System erst neu bauen müssen, denn der Ryzen ist zu dem FX nicht abwärtskompatibel. Es fehlt ein CPU flag. Das gilt allerdings nur, wenn Du jetzt mit "NATIVE" gebaut hast. Sollte Dein aktuellen System nicht mehr in der Lage sein zu kompilieren, befürchte ich, dass Du neu installieren müßtest, denn der Ryzen wird das aktuelle System nicht booten.
Sollte Kompilieren noch möglich sein, erst ein -e world mit -k8 machen und dannach mit der neuen Hardware mit "native" optimieren. _________________ Desktop AMD Ryzen 9 5900X 32GB RAM, Asus GF GTX 1060.
Notebook Tuxedo Pulse 15 Gen1 AMD Ryzen 7 4800H mit Radeon Vega 7
Raspberry Pi 1 + 2 + 3B+ + Zero W |
|
Back to top |
|
|
uhai Veteran
Joined: 23 Aug 2007 Posts: 1397 Location: Eppingen, Germany
|
Posted: Sat Aug 24, 2024 11:37 am Post subject: |
|
|
Danke Leute,
es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....
Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?
Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code] |
|
Back to top |
|
|
firefly Watchman
Joined: 31 Oct 2002 Posts: 5327
|
Posted: Sat Aug 24, 2024 2:28 pm Post subject: |
|
|
uhai wrote: | Danke Leute,
es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....
Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?
Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code] |
Nope der FX ist AM3+.
Ryzen 1xxx bis 5xxx sind AM4 und die aktuellen Ryzen 7xxx bis 9xxx sind AM5
Und da scheinbar auch dein Mainboard hitzeprobleme hat, wäre es eh problematisch das mainboard weiter zu nutzen.
Da, wie du schon selbst vermutest, die Wahrscheinlichkeit groß ist, dass weitere Komponenten nach kurzer zeit Ausfallerscheinungen zeigen können.
Da wird dann auf jeden fall ein neues Board, CPU und RAM fällig.
AM4 benötigt DDR4 RAM. Und AM5 benötigt DDR5 RAM
Von dem was ich so über die aktuellste Generation, Ryzen 9xxx (welche dieses Jahr veröffentlicht wurde), so gelesen habe, ist diese Generation energy effizienter als die Vorgängergeneration 7xxx und liefert dabei bessere Performance als die Vorgängergeneration.
Quellen: https://www.phoronix.com/review/ryzen-9600x-9700x
https://www.phoronix.com/review/amd-ryzen-9950x-9900x
Es gibt "Aufrüstkits" (CPU, RAM, Mainboard) für den AM4 Sockel (Ryzen 5xxx und 4xxx, die 4xxx sind APUs mit integrierter GPU) ab ca. 200€ (Was lieferbar ist)
Quelle: https://www.arlt.com/Hardware/PC-Komponenten/Bundles/_Filter/Prozessor%2BHersteller/AMD/CPU-Sockel/AM4/
Für AM5 gibt es diese ab ca 400€: https://www.arlt.com/Hardware/PC-Komponenten/Bundles/_Filter/Prozessor%2BHersteller/AMD/CPU-Sockel/AM5/
die Ryzen 8xxx sind wie die Ryzen 4xxx APUs _________________ Ein Ring, sie zu knechten, sie alle zu finden,
Ins Dunkel zu treiben und ewig zu binden
Im Lande Mordor, wo die Schatten drohn. |
|
Back to top |
|
|
ChrisJumper Advocate
Joined: 12 Mar 2005 Posts: 2400 Location: Germany
|
Posted: Wed Aug 28, 2024 8:37 pm Post subject: |
|
|
uhai wrote: | Danke Leute,
es ist ein Chipsatz auf dem Board, der zu heiß wird. Ich teste mal mit einem zusätzliche Fan....
Grundsätzlich überlege ich mir — nach 7 Jahren — ob ich nicht Board, CPU, RAM und evtl. GraKa ersetzen sollte..... hat der Ryzen den selben Sockel?
Möglicherweise krepiert ja alterbedingt bald das nächste Bauteil. 7 Jahre finde ich jetzt auch nicht schlecht...[/code] |
Vielleicht auch noch mal die Kühlpaste tauschen! Aber ich denke es ist einfach günstig eine neue CPU anzuschaffen. Die brauchen ja uch viel weniger Strom und es gibt immer welche von 2023 die nicht so teuer sind. Die ganzen Cpu-Probleme der letzten Jahre ziehen sich eh durch, so das es fast keine Rolle spielt ob du Microcode ausrollen mußt und Mitigations per Firmware in Kauf nehmen.
Um einen Sockel-Wechsel kommst du halt nicht drum herum. Aber ich kenne es, bei mancher alter Hartware will man kein Upgrade riskiren weil spezielle veralterte Software drauf läuft und laufen muss. |
|
Back to top |
|
|
|