达梦 中文全文索引数据量多少能用

达梦数据库中文全文索引无数据量强制限制。
单表百万级数据秒级检索。
PB级数据需分布式方案。
高并发选启智分布式。
亿级数据单节点瓶颈。
分词器分中国最少和中国最多。
实时更新和增量更新可选。
避免模糊查询,用CONTAINS谓词。
单列一个索引,重复索引是坑。
数据量大别用单表索引。

linux下怎么安装达梦(DM)数据库

哎哟,说起来我前几年在咱们公司那台红旗Linux服务器上安装达梦数据库,那可真是费了老鼻子劲了。
记得那会,我坐在电脑前,屏幕上各种命令闪来闪去,就跟玩儿杂技似的。

当时,我得先进到达梦数据库的安装目录,然后输入“./DMInstall.bin”,嘿,屏幕上顿时出现了一个图形安装界面,就跟Windows上的安装向导似的。
不过,我这服务器上没装图形界面,那可就尴尬了。
后来,我才发现,原来安装图形界面得先装个X Window System,这玩意儿我那时候是真不知道。

安装界面一出来,我就看到“OK”按钮,点一下,就进了版本信息界面,然后点“下一步”。
那时候,我得去找序列号,就靠那个“less sn.txt”命令一个字一个字地翻,就差没把眼珠子瞪出来了。
找到序列号后,按照提示输入,心里那个紧张啊,就怕输错了。

安装方式嘛,我就选了典型安装,省事儿。
安装位置默认是/opt/DMDBMS,但我那时候考虑到数据库会越来越大,就改成了空间更大的/usr/DMDBMS。
安装过程中,还得创建数据库,这步骤我那时候也记得清清楚楚。

安装完了,我在“应用程序”菜单里看到了达梦数据库的选项,桌面也出现了一个快捷方式。
那时候,我还特意去试了试,创建用户、数据库、表啥的,还真挺方便的,跟Oracle数据库操作差不多。

后来,我还得把Windows系统上的文件传到Linux服务器上。
那会,我试了网络共享,就是用SMB协议,还挺方便的。
我在Windows上把文件夹共享了,然后在Linux终端里输入“smbmount”,跟着提示输入IP、共享目录、用户名和密码,就把文件传输过去了。

记得当时我还把JDK和TOMCAT程序从Windows传到了Linux,命令也记得挺清楚,“cp -R jakarta-tomcat-5 .0.2 8 .tar.gz /usr”和“cp -R jdk-1 _5 _0_1 5 -linux-i5 8 6 -rpm.bin /usr”。
那时候,感觉自己的技术水平又提升了一步。

一说到这些,我都有点怀念那段日子了。

达梦数据库字段类型

上周有个客人问我达梦数据库类型的事,他搞不太清楚这么多类型咋选...我给你捋捋啊,别看花里胡哨的,其实分大类就行。

数值类型这帮兄弟最逗了。
整数里INT最常见,一般数都能装。
你要是存特别大的数,比如订单流水那种,就上BIGINT。
TINYINT就别瞅了,那玩意儿太小的数用着费劲。
SMALLINT比INT小点,但也能存不少数。

定点数类型NUMERIC和DECIMAL差不多,能存精确小数,像钱啊这种。
浮点数FLOAT和DOUBLE精度高,适合科学计算。
REAL就是个备选项,别太在意。
双精度DOUBLEPRECISION精度最高,你要是算金融风控这种复杂模型,它最合适。

字符类型CHAR和VARCHAR最实用。
CHAR定长,省事儿但浪费空间。
VARCHAR灵活,现在都用这个。
NCHAR和NVARCHAR是为了支持中文,你要存中文就得上。
TEXT那种超长文本偶尔用用就行,一般场景少。

日期时间类型DATE最简单,就存年月日。
TIME存时分秒。
TIMESTAMP更全,带秒还带小数秒。
时区相关的几个类型TIMEWITHTIMEZONE啊什么的,你要是跨国业务就用得上。

其他类型BOOL存真假,BINARY和VARBINARY存二进制文件。
BLOB和CLOB是超长数据,像图片啊文档啊。
BFILE把文件存操作系统里,数据库直接用。
你存图片就用BLOB,存大文档用CLOB。

我踩过的坑是,刚开始用VARCHAR结果忘了加长度限制,存了超长数据还报错。
还有用TEXT存数据,结果导出Excel时格式全乱。
所以选类型时得结合实际业务场景,别瞎用。
你要是存中文,记得用NVARCHAR。
存金额就用NUMERIC。
需要高精度计算就上DOUBLEPRECISION。

反正你看着办吧,每个类型都有用武之地,关键看你具体要干啥。