TXT文本文件:轻量级文本存储利器

当我们谈论TXT文本文件时,很多人会自然地想到Windows系统中的“记事本”程序。然而,实际上TXT文本文件只是记事本程序的一个常用功能而已,许多其他程序也都能生成TXT文本文件。虽然TXT文本文件看似简单,但涉及的知识、技能以及相关话题非常广泛。本文将围绕TXT文本文件这一核心,带您走进TXT文本文件的世界,探索其奥秘及其使用技巧。

一、TXT文本文件简介

TXT文本文件,又称纯文本文件,是指保存在计算机中仅包含文字、符号、数字和换行标记的文件,扩展名为.TXT。但这并不意味着所有以.TXT为扩展名的文件都是TXT文本文件。实际上,许多其他扩展名不是.TXT的文件,它们的内容也属于纯文本文件,例如各种程序的源代码。本文主要讨论纯文本文件及其使用技巧,而不对程序代码进行深入探讨。

二、TXT文本文件的特点

1. 占用空间小:TXT文本文件的最大优点就是占用空间小。一个内含3163万字、容量为37.7MB的超大TXT文本文件,如果以纯文本形式存储,其所占用的空间仅为37.7MB。即使是一位疯狂的作家,若用TXT文本文件来存储其所写作作品,那么一辈子仅需一张512MB的闪存卡就足够了。

2. 易于阅读和编辑:与其他非纯文本格式相比,如DOC、PDF等,TXT文本文件具有更高的可读性和编辑性。只需使用基本的文本编辑软件,如Notepad++、Sublime Text等,即可轻松查看和修改TXT文件中的内容。

3. 兼容性强:由于TXT文本文件采用基本的文本编码格式(如UTF-8),因此它具有很强的兼容性。几乎所有操作系统和应用程序都能正确处理TXT文件,使其成为一种通用的文本交换格式。

三、总结

尽管TXT文本文件看似简单,但其实所涉及的知识和技能,以及围绕它所能展开的话题却是十分广泛的。通过本文的介绍,我们了解了TXT文本文件的基本概念、特点以及优势。希望这些信息能帮助您更好地理解和使用TXT文本文件,将其发挥出最大的实用价值。

TXT文本文件的优势之一是易于在网络上传播。由于TXT文本的“体型”小,所以它在网络上传播是最为容易的。在早年带宽或网速比较紧张的互联网环境下,人们既希望在网络上能够传播更多的内容,又希望其他人能够快速地看到这些内容,因此最好的办法便是直接将TXT文本编排在HTML网页中,辅以必要的颜色变化进行发布,而不是将它们做到漂亮的图片中来引人关注;或者干脆直接将一些TXT文本文件做成链接供人们下载,例如早期的网络小说等。

虽然说TXT纯文本文件优点突出,但它的缺点也同样明显。由于TXT文本文件只包含文字、符号、数字等,因此如果它不依托具有更多格式支持的编辑器,就难以展现出形式多样的版面效果。用过记事本之后,你一定有所体会,当我们希望以更加丰富多彩的形式来表达一篇文档的内容时,记事本程序由于对格式支持的功能匮乏而显得很无能。这时,我们一定会首先想到Word、WPS,甚至是Photoshop之类的专用软件。只有使用此类软件,才能排出更加耀眼的作品,赋予文字更大的魅力。

Windows 10的记事本程序也允许我们改变字体种类和大小。在打开的记事本程序中选择菜单命令“格式→字体”,然后在“字体”对话框中选择字体类型以及大小即可。如果对窗口中的字体大小不够满意,则可以使用菜单命令“查看→缩放→放大/缩小”,或者直接在编辑窗口中按下“Ctrl+加号”或“Ctrl+减号”逐步微调字体大小。

在DOS时代,TXT文本文件的编辑工具最早是行编辑命令。后来出现了字符形式的编辑器EDIT,那时已经这是很了不起的编辑器,但如果拿到现在来看真是太简陋了。到了Windows时代,我们最常用的TXT编辑工具是记事本程序,其他文字处理软件也大都支持TXT文本文件的读写,如Windows自带的写字板程序,以及Word、WPS等专业编辑工具。利用各类第三方编辑软件以及程序设计工具软件,也均可以创建和编辑TXT文本文件。

● 不用先开“记事本” 右键创建更简单

先双击记事本程序图标,打开之后输入内容,然后再将TXT文件保存到一个目标位置,这当然是创建TXT文本文件的常规方法。但这种方法不如用右键菜单命令来创建更加方便:直接在目标文件夹内的空白处单击鼠标右键,然后依次选择“新建→文本文档”,这样不但可以立马创建一个文本文件,而且可以顺带将文件名更改为自己想要的名字,最后双击这个空文件,便会自动打开记事本程序来编辑了。(图6:用右键菜单创建TXT文本文件更方便)

◇小技巧:记事本如何创建TXT之外的文本文件

除了创建TXT文本文件外,记事本程序可以创建各类程序的源代码文件,这些其实也是文本文件。许多程序员在应急时都会使用记事本程序来创建源代码文件。创建的方法也很简单,只需开启一个新的记事本程序窗口,输入程序代码内容,在下达另存文件命令“文件→另存为”或按下“Ctrl+Shift+S”时,将“保存类型”选择为“所有文件 (*.*)”,然后在“文件名”框中输入自己所需要的程序文件名及扩展名即可。例如,当我们输入了C++语言的源代码之后,将其命名保存为“mypro.c”文件即可。(图7:用记事本创建TXT之外的程序代码文本)

● 利用专业编辑工具 创建TXT文本文件

用专业级的文字编辑软件,如Word或WPS等,创建TXT文本文件的基本方法非常简单。只需在“文件”菜单中选择“另存为”命令,起好一个名字,即可完成TXT文本文件的创建。其实,创建文本文件另外还有其他方法和技巧,例如“选择性粘贴”法、记事本过滤法等。(图8:用WPS创建TXT文本文件)

“选择性粘贴”法是将复制的一些带有排版格式的文字内容,滤掉格式之后,仅留下其文字内容以获得纯TXT文本的方法。常用来将来自网页或专业文档编辑工具中的带格式文本转换为无格式的纯TXT文本。在WPS办公软件、微软Office软件,以及一些网络浏览器中,均含有“选择性粘贴”的特殊粘贴选项。

而记事本过滤法则是另一种过滤格式的方法。我们可以先将含有格式的文本复制并粘贴到记事本程序中,由于记事本程序对许多格式的不支持,这样在粘贴的过程中便会自动丢失这些格式,直接将带格式的文本复制过来,即可获得TXT纯文本。最后将文件保存下来,即可获得TXT文本文件。

● TXT文本文件创建与处理的“大拿”——EmEditor

EmEditor是一款源自日本的文本编辑和处理工具,它丰富的文本处理功能以及对大文本的处理能力深受以处理TXT文本为主的文字编辑以及各类程序员们的青睐。

EmEditor支持超级查找和替换,由于可以使用正则表达式,给文本处理提供了极大的想象和实现的空间。无限扩展的插件又给该软件提供了功能的不断扩充,能够满足更多文本处理的需求。利用EmEditor软件的插件,我们可以方便地实现字体和行距的改变、字号的缩放、大小写的转换、窗口的分割与合并、段前段后空格以及空行的自动删除、重复行的删除、字数统计、繁简体字转换等操作。如果TXT文本文件中有一系列数据或者是一个名单列表,那么还可以实现文本列表中数据的排序。

而有规律的重复性动作依靠“宏”录制和利用可以让重复劳动自动执行从而大大解放操作者双手。在该软件中我们还可以轻松实现两个文本文件比较、大文本文件读取和分割合并等操作。

下面我们将会结合一些具体实例讲述该软件在日常操作中的应用。虽然TXT文本文件创建比较简单但在日常使用过程中有许多技巧需要掌握否则在遇到某些问题时可能会感觉无从下手或疑惑不解。这里列举了一些与TXT文

你可能觉得打开一个TXT文件不是一件容易的事,但是如果你手头上拥有一个从服务器数据库中导出的容量为上百MB的“大个头”日志TXT文件,试试看是什么体验。

有一位读者问,为何我在一个还不算慢的电脑上,用记事本打开一个30MB的文本文件,等了好一阵子才看到其中的内容?这是因为记事本程序会一股脑儿地全部加载到内存中,然后才一个接一个字符显示。在这期间,由于我们通常会设置窗口内自动换行显示,因此该程序还会对每个行进行文本断行的判断和操作。这样一来,假如要读取的文本文件是30MB,也就是31457280字节,那么记事本程序就会为此行为而执行3000多万次循环操作。如此一来,不慢那该怪呢!

我们平时之所以感觉用记事本程序打开TXT文件是很轻而易举的事情,那是因为它主要是为打开普通容量的TXT文件而设计和准备的,况且人们日常使用电脑也不会有超大的TXT文本。但当下大数据越来越火爆的日子里,百MB的TXT文件毕竟也可能会遇到。在早期的Windows版本中,例如Windows 98的记事本程序只能打开小于64KB的文本文件。如果打开的文本文件超过这个值,则会提示“文件太大,记事本无法打开”。这时有人便想出一个办法:用修改十六进制文件的编辑器(例如UltraEdit或Winhex)打开notepade.exe文件,修改其中某个地址的偏移值即可打开大于64KB的文件。

有很多文本编辑器可以打开大文件,例如EmEditor、JOE、ltfviewr、Snaptext等。这些编辑器都支持打开和编辑比物理内存大的文件,而且只占用一点内存,让您能随心所欲地处理任何大小的文件。其中,EmEditor能够打开非常大的文件,大到16 TB或1.09兆行,而且只占用一点内存。

TXT文件的编码并非唯一,乱码或编码选择提示通常是由于保存时的编码格式与读取环境所要求的编码格式不匹配造成的。在用记事本程序编辑完一篇文本后,如果要保存文件,Windows 10中默认的编码格式一般为UTF-8。实际上,还有其他可选格式,如ANSI、UTF-16BE/LE等,可以在“编码”下拉列表中查看。

在实际应用中,我们常见的文本编码有ASCII、ANSI和UNICODE三种。其中,ASCII编码是后两种编码或大多数常用编码的基础。ASCII编码是Windows早期的编码,只能表示256个符号(包括控制符号),用它来表示英文足够。然而,用来表示汉字等双字节符号就不够了,因此后来出现了中文字符集GB2312,以及后来的GBK大字符集,这些都属于ANSI编码。由于这些编码在各国语言环境下的兼容性问题,因此又发明了Unicode统一字符集。我们在记事本程序的“另存为”对话窗口中看到的编码,除ANSI之外的其他几种选择,就属于Unicode统一字符集之列。而UTF-8则是目前、尤其是网页中比较流行的一种格式,被Windows 10记事本程序设为默认的保存编码格式。

如果将一段文本保存为上述的不同格式,那么若是转到Windows系统语言为日语或其他类语言的环境下,打开用ANSI编码的文件阅读时,就可能会看到乱码显示。而用Unicode字符集的其他编码格式保存的文件,都能正常显示。由此也可以获得一个启示:如果我们需要将TXT文本发送给国外的朋友阅读,那么就要选择Unicode字符集的编码来保存后发送,例如选择UTF-8编码。

此外,如果在打开一篇TXT文本时出现了乱码显示,可以将其以该文本默认格式之外的一种其他编码格式另存,然后重新打开,一般可以恢复原有的正常显示状态。在使用记事本程序时,还可以尝试在“字体”设置对话框中,将“脚本”选择为一种其他类型。

EmEditor文本文件的妙用

EmEditor是一款功能强大的文本编辑器,除了可以用于编辑和处理各种类型的文本文件外,还可以实现一些实用的功能。本文将介绍EmEditor中关于TXT文本文件的两个实用技巧:一是更改系统区域设置以消除乱码文本显示;二是利用TXT文本文件标签完成多项任务。

一、更改系统区域设置以消除乱码文本显示

1. 在Windows 10中搜索“区域设置”,进入区域设置窗口后点击“其他日期、时间和区域设置”。

2. 在出现的控制面板“区域”窗口中,切换到“管理”选项卡。

3. 点击“更改系统区域设置”按钮,并将当前系统区域设置切换为一种不同的选项。

4. 勾选“使用Unicode UTF-8提供全球语言支持”复选框。

5. 这样也可以消除乱码文本显示。

二、TXT文本文件标签的妙用

1. 在EmEditor窗口中打开TXT文本文件后,右键单击该文件的标签。

2. 从弹出的菜单中选择需要的选项来完成任务,如“从该文件夹中打开...”、“打开所在文件”(或直接按下“Alt+Shift+E”组合键)、“打开命令提示符”或“打开PowerShell”选项。

3. 如果正在处理的某个程序代码文本或说明文档中正好需要引用该TXT文本文件所在的磁盘路径,那么选择“复制路径”即可。

三、TXT文本文件的拆分处理

对于一个“体量”比较大的文本文件,我们除了可以用上面介绍的支持大文件阅读和处理的编辑器来处理外,还可以采取化整为零的策略,即将大文本文件拆分为一些小文件。EmEditor软件就有这样的功能,我们以拆分一个38MB大小的TXT文件为例,该文件有95万多行的内容。

1. 在EmEditor编辑窗口中点击“工具→分割文件”菜单命令,然后打开上述的TXT文件。如果文件已经在编辑窗口中打开,那么选择“当前文件”。接着指定分割的行数单元,例如我们按每10000行为一个文件来切分,则输入10000。

2. 在下一页中,软件会默认给出分割的文件所在的文件夹以及文件名的模板,用户也可以自行定义位置和文件名,我们就以默认的设置为例。

当参数配置完成之后,我们还可以选择将参数保存起来以供下次使用。如果想要按照文件的内容大意,有的放矢地分类切割文本文件,我们依然可以使用EmEditor软件的切割功能,利用它所提供的“书签”功能来辅助切割,便可以实现。具体方法如下:首先,选中需要切割的分界段落,然后点击“书签→设置或清除书签”(或直接按下快捷键“Ctrl+F2”),这样便会给分界段落加上一个书签。当然,这个分界段落也可以是一个空行。按此方法给所有切割分界加上书签。然后再执行“工具→分割文件”命令,并选择“在每个书签行之前”选项,这样便会以设定好的书签之前为界限,将文本文件按照设定好的书签数来进行分割了。本例中我们设置了3个书签,最后便会生成4个分割文件。

要给Word、WPS或PDF文件加密,此类的编辑软件中一般均提供了文件加密码保存的功能。但是,如果要将一篇涉密的TXT文本文件加密保存,那么依靠Windows记事本程序恐怕就难以做到了。在这种情况下,除了借用上述的专业编辑器的加密功能外,我们当然还可以将文本用WinRAR或好压等压缩工具压缩,并在压缩的同时设置密码保护,然后删除源文件。除此之外还有别的方案吗?其实,还有专门加密TXT的软件可选。例如上面介绍过的FileFriend软件。该软件除了具有文件的拆分和合并功能外,它还可以对拆分之前或拆分后的文件加密,有两种加密方法可选。为了避开Windows记事本程序只能编辑文本但不能加密文本的麻烦,我们还可以使用Crypto Notepad软件来编辑和保存文本。用它在编辑器内编辑完文本后,直接保存为加密格式更加方便、安全。

图28:使用Crypto Notepad编辑并加密保存TXT文本)

在过去,Windows记事本一直是许多人编辑TXT文本文件的首选工具。然而,随着功能强大的文本编辑器的出现,越来越多的用户开始寻找替代记事本的工具。本文将介绍一些可以替代Windows记事本的、功能更为强大的编辑器。

除了之前提到的一些TXT文本文件的编辑器外,实际上还有许多其他实用且小巧的编辑器可以替代记事本。在本刊之前的报道中,我们曾介绍过一些这类优秀的工具软件。

总之,随着技术的发展和创新,越来越多的文本编辑器涌现出来,为用户提供了更加丰富和便捷的编辑体验。让我们拭目以待,期待更多的精彩内容!