字符串不可变的非技术优势 - java

我想知道从程序员的角度来看字符串类型不可变的好处。

技术优势(在编译器/语言方面)可以概括为,如果类型是不可变的,则更容易进行优化。阅读here以获得相关问题。

另外,在可变的字符串类型中,要么您已经内置了线程安全性(然后又很难进行优化),要么您必须自己进行。无论如何,您都可以选择使用具有内置线程安全性的可变字符串类型,因此这并不是可变字符串类型的真正优势。 (同样,更容易进行处理和优化以确保不可变类型上的线程安全,但这不是重点。)

但是,不可变字符串类型在用法中有什么好处?使某些类型不可变而其他类型不可变又有什么意义呢?这对我来说似乎很不一致。

在C++中,如果我想使某些字符串不可变,则将其作为对函数的const引用(const std::string&)传递。如果我想要原始字符串的可变副本,请将其作为std::string传递。仅当我想使其可变时,才将其作为参考传递(std::string&)。因此,我可以选择要执行的操作。我可以使用所有可能的类型来做到这一点。

在Python或Java中,某些类型是不可变的(大多数都是原始类型和字符串),而其他则不是。

在像Haskell这样的纯函数式语言中,一切都是不可变的。

有充分的理由使这种不一致有意义吗?还是纯粹出于技术上的低级原因?

参考方案

吃点东西有什么意义
类型不可变,其他类型不可变吗?

如果没有一些可变的类型,您将不得不全力以赴地进行纯函数式编程-与目前最流行的OOP和过程方法完全不同的范例,并且尽管功能非常强大,但对许多程序员来说显然非常具有挑战性(当您确实需要一种无法改变的语言带来的副作用时,会发生什么?挑战当然是在现实世界中编程不可避免地要做的事情-Haskell的Monads是一种非常优雅的方法,例如,但是有多少种方法程序员是否知道您完全自信地理解它们,并且可以将其与典型的OOP构造一起使用?-)。

如果您不了解拥有多个范式的巨大价值(FP范式和至关重要的两个变量都依赖可变数据),我建议您学习Haridi和Van Roy的杰作Concepts, Techniques, and Models of Computer Programming-“21世纪的SICP”,因为我一旦描述过;-)。

大多数程序员,无论是否熟悉Haridi和Van Roy,都会很容易地承认,至少一些可变数据类型对他们很重要。尽管我从您的Q中引用了上面的句子,这句话的观点截然不同,但我认为这可能也是您困惑的根源:不是“为什么每个都有些”,而是“为什么有些不可变的” 。

在Fortran实现中曾经(偶然地)获得了“彻底可变”的方法。如果有的话

  SUBROUTINE ZAP(I)
  I = 0
  RETURN

然后是一个程序段,例如

  PRINT 23
  ZAP(23)
  PRINT 23

会先打印23,然后打印0-的数字23 已被更改,因此程序其余部分对23的所有引用实际上都将引用0。从技术上讲,这不是编译器中的错误:Fortran对于哪些内容有微妙的规则您的程序是否可以将常量和变量传递给分配给其参数的过程,并且此代码段违反了那些鲜为人知且不可编译的规则,因此这是程序中的一个问题,而不是编译器中的问题。当然,实际上,以这种方式引起的错误数量很高,因此,典型的编译器很快会在这种情况下切换到破坏性较小的行为(如果操作系统支持,则将只读段中的常量获取运行时错误;或者,尽管开销很大,但传递常量的新副本而不是常量本身;依此类推),尽管从技术上讲它们是程序错误,允许编译器“正确地”显示未定义的行为;-)。

在某些其他语言中强制执行的替代方法是增加参数传递的多种方式的复杂性-最值得注意的可能是在C++中,它带有按值,按引用,按常量引用,按指针,按常量指针等等。然后当然会看到程序员对const foo* const bar之类的声明感到困惑(如果const是某个函数的参数,则最右边的bar基本无关紧要……但是如果bar是局部变量,则至关重要)。

实际上,Algol-68可能沿着这个方向走得更远(如果您可以有一个值和一个参考,为什么不参考一个参考呢?还是参考这个参考呢?&c-Algol 68对此没有限制,并且规则定义正在发生的事情可能是“打算用于实际用途”编程语言中发现的最微妙,最困难的组合)。早期的C语言(仅具有按值和明确的指针,没有const,没有引用,没有并发症),对它的反应无疑是部分的,就像最初的Pascal一样。但是const很快流行起来,并且复杂性又开始增加。

Java和Python(以及其他语言)以强大的简化方式切入了这个丛林:所有参数传递和所有赋值都是“按对象引用”(从不引用变量或其他引用,从不包含语义隐式副本,&c) 。将数字定义为(至少)语义上不可变的,可以避免上面的Fortran代码所展示的“麻烦”,从而保留了程序员的理智(以及语言简单性的这一宝贵方面)。

将字符串像数字一样对待为基本体与语言预期的较高语义水平是完全一致的,因为在现实生活中,我们确实需要与数字一样简单易用的字符串。将字符串定义为字符列表(Haskell)或字符数组(C)之类的替代方案对编译器(在这种语义下保持高效的性能)和程序员(有效地忽略这种任意结构以使字符串使用简单)都构成了挑战原语,就像现实生活中编程经常需要的那样)。

Python通过添加一个简单的不可变容器(tuple)并在“有效不可变性”上附加了哈希值来进一步发展(这避免了对程序员的某些惊讶,例如在Perl中发现的,其哈希允许可变字符串作为键)那么为何不?一旦有了不变性(这是一个宝贵的概念,可以使程序员不必学习用于赋值和参数传递的N种不同的语义,随着时间的流逝,N会逐渐增加;-),您也可能会从中受益匪浅;-) 。

Java:找到特定字符并获取子字符串 - java

我有一个字符串4.9.14_05_29_16_21,我只需要获取4.9。数字各不相同,所以我不能简单地获得此char数组的前三个元素。我必须找到最正确的.并将其子字符串化直到那里。我来自Python,因此我将展示Python的实现方法。def foobar(some_string): location = some_string.rfind('.&…

Java string.hashcode()提供不同的值 - java

我已经在这个问题上停留了几个小时。我已经注释掉所有代码,认为这与数组超出范围有关,但是这种情况仍在发生。我正在尝试使用扫描仪从文件中读取输入,存储数据并稍后使用哈希码获取该数据。但是哈希值不断变化。public static void main(String[] args) { //only prior code is to access data char…

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…