18.1 如果MySQL总是崩溃怎么办
所有MySQL在发布它们之前,在许多平台上被测试。这并不意味着在MySQL中没有任何错误,但是如果有错误,它们是很少的并且很能难发现。如果你有一个问题并且如果你尝试找出究竟是什么摧毁了你的系统,它将总是有帮助的,因为你将有一个更好机会使得它被快速修复。
首先你应该试着找出问题mysqld守护进程是否死掉或你的问题是否与你的客户有关。你可以用mysqladmin version检查你的mysqld服务器正常执行了多长时间,如果mysqld死了,你可以在文件“mysql-data-directory/'hostname'.err”中找到其原因。
因为很难知道一些东西为什么崩溃,首先试着检查为其它人工作的东西是否使你崩溃。请尝试下列事情:
- 与mysqladmin shutdown停止mysqld守护进程,在所有表上运行myisamchk --silent --force */*.MYI并重启mysqld守护经进程。这将保证你从一个干净的状态运行。见13 维护MySQL安装。
- 使用mysqld --log并且试着从日志信息确定是否是某个特定的查询杀死了服务器。全部错误的95%与特定的查询有关!通常它是在日志文件中就在MySQL重启之前的最后查询之一。你也许可以使用下列过程验证它:
- 停止MySQL守护进程(用mysqladmin shutdown)。
- 在MySQL数据库目录下做文件的一个备份。
- 与myisamchk -s */*.MYI检查表以验证所有表是正确的。如果有任何表被损坏,用myisamchk -r path-to-table.MYI修复它。
- 从MySQL数据目录删除(或移走)任何旧的日志文件。
- 用safe_mysql --log启动服务器。
- 如果mysqld现在死掉,你可以通过恢复备份并执行mysql < mysql-log-file来测试问题是否是一个特定的查询引起的。当然你可以通过用safe_mysqld --data=path-to-backup-directory启动另一个MySQL服务器,在某个其他目录而不是标准MySQL数据库目录下做后面的测试。
- 你试用了基准测试吗?他们应该很好地测试MySQL。你也可以增加代码模拟你的应用程序!基准程序可在源代码分发的“bench”目录下找到,或对二进制分发,在你的MySQL安装目录下“sql-bench”目录。
- 试一下fork_test.pl和fork2_test.pl。
- 对任何错误检查文件“mysql-data-directory/'hostname'.err”。
- 如果你配置MySQL以便调试,如果出错,收集可能的错误信息将更容易。使用--with-debug选项的configure重新配置MySQL然后重新编译。见G.1 调试一个 MySQL 服务器。
- 为调试而配置MySQL使它包含一个安全的内存分配器以便能发现一些错误。它也提供关于正在发生什么的大量输出。
- 你为你的操作系统使用了最新的补丁吗?
- 使用mysql的--skip-locking选项.在一些系统上,lockd锁管理器不能正确工作;--skip-locking选项告诉mysqld不使用外部锁。(这意味着你不能在同一个数据上运行两个mysqld服务器而且如果你使用myisamchk,你一定要小心,但是它对为了测试试用选项可能有益。)
- 当mysqld好象正在运行但没有反应时,你尝试过mysqladmin -u root processlist吗?有时mysqld不是毫无反应,尽管你可能这样认为。问题可能是所有在用的连接,或可能用内部锁定问题。mysqladmin processlist甚至在这些情况下将通常可以进行一个连接,并且能提供有关当前连接数量及其状态的有用信息。
- 在你运行其他查询时,在一个单独窗口中运行命令mysqladmin -i 5 status,产生统计。
- 尝试下列步骤:
- 通过gdb(或其他调试器)启动mysqld。
- 运行你的测试脚本。
- 当mysqld核心倾倒(core dump),做back(或你调试器中的回溯-backtrace命令)。
- 尝试用一个Perl脚本模拟你的应用程序以强制MySQL崩溃或表现不正确。
- 或发一份正式的错误报告。见2.3 如何报告错误或问题,但是要不平常更详细。因为MySQL为很多人的工作,导致崩溃的东西可能只存在于你的计算机上(例如,与你的特定系统库有关的一个错误)。
- 如果你的问题有具有动态长度行的表有关,并且你不使用BLOB/TEXT列(但是仅VARCHAR列),你可以用ALTER TABLE试着将全部VARCHAR改为CHAR,这将强制MySQL使用固定尺寸的行。固定尺寸的行占据很小的额外空间,但是更能容忍崩溃!当前动态行的代码在 TCX 至少使用3 年的时间,没有任何问题,但是从本质上讲,动态长度的行对错误更敏感,因此如果上述对你有帮助,尝试一下可能是一个好主意!
18.2 使用MySQL时的一些常见错误
18.2.1 MySQL server has gone away错误
本小节也涉及有关Lost connection to server during query的错误。
对MySQL server has gone away错误最常见的原因是服务器超时了并且关闭了连接。缺省地,如果没有事情发生,服务器在 8个小时后关闭连接。你可在启动mysqld时通过设置wait_timeout变量改变时间限制。
你可以通过执行mysqladmin version并且检验正常运行的时间来检查MySQL还没死掉。
如果你有一个脚本,你只须再发出查询让客护进行一次自动的重新连接。
在这种请下,你通常能获得下列错误代码(你得到的是OS相关的):
CR_SERVER_GONE_ERROR
客户不能发送一个问题给服务器。
CR_SERVER_LOST
当写服务器时,客户没有出错,但是它没有得到对问题的一个完整的答案(或任何答案)。
如果你向服务器发送不正确的或太大的查询,你也可能得到这些错误。如果mysqld得到一个太大或不正常的包,它认为客户出错了并关闭连接。如果你需要较大的查询(例如,如果你正在处理较大的BLOB列),你可以使用-O max_allowed_packet=#选项(缺省1M)启动mysqld以增加查询限制。多余的内存按需分配,这样mysqld只有在你发出较大差询时或mysqld必须返回较大的结果行时,才使用更多的内存!
18.2.2 Can't connect to [local] MySQL server错误
一个MySQL客户可以两种不同的方式连接mysqld服务器:Unix套接字,它通过在文件系统中的一个文件(缺省“/tmp/mysqld.sock”)进行连接;或TCP/IP,它通过一个端口号连接。Unix套接字比TCP/IP更快,但是只有用在连接同一台计算机上的服务器。如果你不指定主机名或如果你指定特殊的主机名localhost,使用Unix套接字。
错误(2002)Can't connect to ...通常意味着没有一个MySQL服务器运行在系统上或当试图连接mysqld服务器时,你正在使用一个错误的套接字文件或TCP/IP端口。
由检查(使用ps)在你的服务器上有一个名为mysqld的进程启动!如果没有任何mysqld过程,你应该启动一个。见4.15.2 启动MySQL服务器的问题。
如果一个mysqld过程正在运行,你可以通过尝试这些不同的连接来检查服务器(当然,端口号和套接字路径名可能在你的安装中是不同的): shell> mysqladmin version
shell> mysqladmin variables
shell> mysqladmin -h `hostname` version variables
shell> mysqladmin -h `hostname` --port=3306 version
shell> mysqladmin -h 'ip for your host' version
shell> mysqladmin --socket=/tmp/mysql.sock version
注意hostname命令使用反引号“`”而非正引号“'”;这些导致hostname输出(即,当前主机名)被代替进mysqladmin命令中。
这是可能造成Can't connect to local MySQL server错误的一些原因:
- mysqld不在运行。
- 你正在使用MIT-pthreads的一个系统上运行。如果正在运行在一个没有原生线程的系统上,mysqld使用 MIT-pthreads 软件包。见4.2 由MySQL支持的操作系统。然而,MIT-pthreads不支持Unix套接字,因此当与服务器连接时,在这样一个系统上,你总是必须明确地指定主机名。试试使用这个命令检查到服务器的连接:
shell> mysqladmin -h `hostname` version
- 某人删除了mysqld使用的Unix套接字(缺省“/tmp/mysqld.sock”)。你可能有一个cron任务删除了MySQL套接字(例如,一个把旧文件从“/tmp”目录中删除的任务)。你总是可以运行mysqladmin version并且检查mysqladmin正在试图使用的套接字确实存在。在这种情况下,修复方法是删除cron任务而不删除“mysqld.sock 或将套接字放在其他地方。你能用这个命令在MySQL配置时指定一个不同的套接字地点:
shell> ./configure --with-unix-socket-path=/path/to/socket
你也可以使用--socket=/path/to/socket选项启动safe_mysqld和在启动你的MySQL客户前设置环境变量MYSQL_UNIX_PORT为套接字路径名。你可用--socket=/path/to/socket选项启动mysqld服务器。如果你改变了服务器的套接字路径名,你也必须通知MySQL客户关于新路径的情况。你可以通过设置环境变量MYSQL_UNIX_PORT为套接字路径名或由提供套接字路径名作为客户的参数做到。你可用这个命令测试套接字: shell> mysqladmin --socket=/path/to/socket version
- 你正在使用 Linux和线程已经死了(核心倾倒了)。在这种情况中,你必须杀死其它mysqld线程(例如在启动一个新的MySQL服务器之前,可以用mysql_zap脚本)。见18.1 如果MySQL总是崩溃怎么办。
如果你得到错误Can't connect to MySQL server on some_hostname,你可以尝试下列步骤找出问题是什么:
- 通过执行telnet your-host-name tcp-ip-port-number并且按几次回车来检查服务器是否正常运行。如果有一个MySQL运行在这个端口上,你应该得到一个包含正在运行的MySQL服务器的版本号的应答。如果你得到类似于telnet: Unable to connect to remote host: Connection refused的一个错误,那么没有服务器在使用的端口上运行。
- 尝试连接本地机器上的mysqld守护进程,并用mysqladmin variables检查mysqld被配置使用的TCP/IP端口(变量port)。
- 检查你的mysqld服务器没有用--skip-networking选项启动。
18.2.3 Host '...' is blocked错误
如果你得到象这样的一个错误: Host 'hostname' is blocked because of many connection errors.
Unblock with 'mysqladmin flush-hosts'
这意味着,mysqld已经得到了大量(max_connect_errors)的主机'hostname'的在中途被中断了的连接请求。在max_connect_errors次失败请求后,mysqld认定出错了(象来字一个黑客的攻击),并且阻止该站点进一步的连接,直到某人执行命令mysqladmin flush-hosts。
缺省地,mysqld在10个连接错误后阻塞一台主机。你可以通过象这样启动服务器很容易地调整它: shell> safe_mysqld -O max_connect_errors=10000 &
注意,对给定的主机,如果得到这条错误消息,你应该首先检查该主机的TCP/IP连接有没有问题。如果你的TCP/IP连接不在运行,增加max_connect_errors变量的值对你也不会有帮助!
18.2.4 Too many connections错误
如果在你试土连接MySQL时,你得到错误Too many connections,这意味着已经有max_connections个客户连接了mysqld服务器。
如果你需要比缺省(100)更多的连接,那么你应该重启mysqld,用更大的 max_connections 变量值。
注意,mysqld实际上允许(max_connections+1)个客户连接。最后一个连接是为一个用Process权限的用户保留的。通过不把这个权限给一般用户(他们不应该需要它),有这个权限一个管理员可以登录并且使用SHOW PROCESSLIST找出什么可能出错。见7.21 SHOW句法(得到表,列的信息)。
18.2.5 Out of memory错误
如果你发出查询并且得到类似于下面的错误: mysql: Out of memory at line 42, 'malloc.c'
mysql: needed 8136 byte (8k), memory in use: 12481367 bytes (12189k)
ERROR 2008: MySQL client ran out of memory
注意,错误指向了MySQL客户mysql。这个错误的原因很简单,客户没有足够的内存存储全部结果。
为了修正这个问题,首先检查你的查询是否正确。它应该返回这么多的行,这合理吗?如果是这样,你可以使用mysql --quick,它使用mysql_use_result()检索结果集合。这将较少的负担放在了客户端(只是服务器更多)。
18.2.6 Packet too large错误
当一个MySQL客户或mysqld服务器得到一个比max_allowed_packet个字节长的包,它发出一个Packet too large错误并终止连接。
如果你正在使用mysql客户,你可以通过用mysql --set-variable=max_allowed_packet=8M指定一个更大的缓冲区来启动客户程序。
如果你正在使用不允许你指定最大包大小的其他客户(例如 DBI),你需要在你启动服务器时设置包大小。你可以使用mysqld的命令行选项设置max_allowed_packet为一个更大的尺寸。例如,如果你正期望将一个全长的BLOB存入一张表中,你将需要用--set-variable=max_allowed_packet=24M选项来启动服务器。
18.2.7 The table is full错误
这个错误发生在内存临时表变得比tmp_table_size字节大时。为了避免这个问题,你可以使用mysqld的-O tmp_table_size=#选项来增加临时表的大小,或在你发出有疑问的查询之前使用SQL选项SQL_BIG_TABLES。见7.25 SET OPTION句法。
你也可以使用--big-tables选项启动mysqld。这与为所有查询使用SQL_BIG_TABLES完全相同。
18.2.8 Commands out of sync in client错误
如果你在你的客户代码中得到Commands out of sync; You can't run this command now,你正在以错误的次序调用客户函数!
这可能发生,例如,如果你正在使用mysql_use_result()并且在你已经调用了mysql_free_result()之前试图执行新查询。如果你在mysql_use_result()或mysql_store_result()之间试图执行返回数据的2个查询,它也可能发生。
18.2.9 Ignoring user错误
如果你得到下列错误:
Found wrong password for user: 'some_user@some_host'; Ignoring user
这意味着在mysqld启动时或在它再次装载权限表时,它在user表中找到了一个有一个无效口令的条目。结果,条目简单地被权限系统忽略。
可能导致这个问题的原因和修正:
18.2.10 Table 'xxx' doesn't exist错误
如果你得到错误Table 'xxx' doesn't exist或Can't find file: 'xxx' (errno: 2),这意味着在当前数据库中没有名为xxx的表存在。
注意,因为MySQL使用目录和文件存储数据库和表,数据库和表名件是区分大小写的!(在Win32上,数据库和表名不是区分大小写的,但是在查询中对所有表的引用必须使用相同的大小写!)
你可以用SHOW TABLES检查你在当前数据库中有哪个表。见7.21 SHOW句法(得到表、列的信息)。
18.3 MySQL怎样处理一个溢出的磁盘
当出现一个磁盘溢出的情况时,MySQL做下列事情:
- 它每分钟检查一次看是否有足够空间写入当前行。如果有足够的空间,它继续好像发生什么事情。
- 每6分钟它将有关磁盘溢出的警告写入日志文件。
为了缓和这个问题,你可以采取下列行动:
- 继续,你只需释放足够的空闲磁盘空间以便插入所有记录。
- 放弃线程,你必须发一个mysqladmin kill到线程。在下一次检查磁盘时,线程将被放弃(在1分钟内)。
- 注意,其他线程可能正在等待引起“磁盘溢出”条件的表。如果你有几个“锁定的”的线程,杀死正在等待磁盘溢出条件的那个线程将允许其他线程继续。
18.4 如何从一个文本文件运行SQL命令
一般地,mysql客户被交互性地使用,象这样: shell> mysql database
然而,也可以把你的SQL命令放在一个文件中并且告诉mysql从该文件读取其输入。要想这样做,创造一个文本文件“text_file”,它包含你想要执行的命令。然后如下那样调用mysql: shell> mysql database < text_file
你也能启动有一个USE db_name语句的文本文件。在这种情况下,在命令行上指定数据库名是不必要的: shell> mysql < text_file
见12.1 不同的MySQL程序概述。
18.5 MySQL在哪儿存储临时文件
MySQL使用TMPDIR环境变量的值作为存储临时文件的目录的路径名。如果你没有设置TMPDIR,MySQL使用系统缺省值,它通常是“/tmp”或“/usr/tmp”。如果包含你的临时文件目录的文件系统太小,你应该编辑safe_mysqld设定TMPDIR指向你有足够空间的一个文件系统!你也可以使用mysqld的--tmpdir选项目设置临时目录。
MySQL以“隐含文件”创建所有临时文件。这保证了如果mysqld被终止,临时文件也将被删除。使用隐含文件的缺点是你将看不到一个大的临时文件填满 [1] [2] [3] 下一页
|