Source code for optking.IRCfollowing

import logging
import copy
from math import acos, sqrt, tan

import copy
import numpy as np

from . import IRCdata, convcheck
from .displace import displace_molsys
from .exceptions import AlgError
from .linearAlgebra import symm_mat_eig, symm_mat_inv, symm_mat_root, lowest_eigenvector_symm_mat
from .printTools import print_array_string, print_mat_string
from .stepAlgorithms import OptimizationInterface
from . import log_name
from . import op

logger = logging.getLogger(f"{log_name}{__name__}")



[docs]
class IntrinsicReactionCoordinate(OptimizationInterface):
    def __init__(self, molsys, history, params):
        super().__init__(molsys, history, params)
        self.orig_molsys = copy.deepcopy(molsys)

        self.params = params
        # grab irc specific information
        # self.irc_direction = params.irc_direction
        # self.irc_step_size = params.irc_step_size
        # self.irc_points = params.irc_points
        self.irc_step_number = 0
        self.sub_step_number = -1
        self.total_steps_taken = 0
        self.irc_history = IRCdata.IRCHistory()
        self.irc_history.set_atom_symbols(self.molsys.atom_symbols)
        self.irc_history.set_step_size_and_direction(
            self.params.irc_step_size, self.params.irc_direction
        )
        self.orig_molsys = copy.deepcopy(molsys)


[docs]
    def to_dict(self):
        return {
            "irc_step_number": self.irc_step_number,
            "sub_step_number": self.sub_step_number,
            "total_steps_taken": self.total_steps_taken,
            "irc_history": self.irc_history.to_dict(),
        }



[docs]
    @classmethod
    def from_dict(cls, d, molsys, history, params):
        irc = cls(molsys, history, params)
        irc.irc_step_number = d["irc_step_number"]
        irc.sub_step_number = d["sub_step_number"]
        irc.total_steps_taken = d["total_steps_taken"]
        irc.irc_history = IRCdata.IRCHistory.from_dict(d.get("irc_history"))
        return irc



[docs]
    def requires(self):
        return "energy", "gradient", "hessian"



[docs]
    def take_step(self, fq=None, H=None, energy=None, return_str=False, **kwargs):
        if self.sub_step_number == -1:
            self.history.append(
                self.molsys.geom,
                energy,
                fq,
                self.molsys.gradient_to_cartesians(-1 * fq),
            )
            if self.irc_step_number == 0:
                logger.info("\tBeginning IRC from the transition state.")
                logger.info("\tStepping along lowest Hessian eigenvector.")
                logger.debug(print_mat_string(H, title="Transformed Hessian in internals."))

                # Add the transition state as the first IRC point
                q_0 = self.molsys.q_array()
                x_0 = self.molsys.geom
                f_x = self.molsys.gradient_to_cartesians(fq)

                self.irc_history.add_irc_point(0, q_0, x_0, fq, f_x, energy)
                self.irc_step_number += 1

                # Looked like we just undid this; however, this is not correct. Compute
                # step in mass-weighted internal coordinates then convert back to our standard
                # intco basis
                G_root = symm_mat_root(self.molsys.Gmat(massWeight=True))
                G_root_inv = symm_mat_inv(G_root, redundant=True)
                H_m = G_root @ H @ G_root
                v_m = lowest_eigenvector_symm_mat(H_m)

                logger.debug(print_mat_string(G_root, title="G^(1/2) Matrix"))
                logger.debug(print_mat_string(H_m, title="Mass-weighted Hessian"))
                logger.debug(
                    print_array_string(v_m, title="Lowest eigenvector of Mass-Weighted Internal Coordinate Hessian")
                )
                v = G_root_inv @ v_m

                if self.params.irc_direction == "BACKWARD":
                    v *= -1
            else:
                logger.info("\tBeginning search for next IRC point.")
                logger.info("\tStepping along gradient.")
                v = -1 * fq
                self.irc_step_number += 1

            dq, return_str = self.compute_pivot_and_guess_points(v, fq, return_str=True)

            # Complete history entry of step.
            # Compute gradient and hessian in step direction
            dq_norm, dq_unit, grad, hess = self.step_metrics(dq, fq, H)
            DE = irc_de_projected(dq_norm, grad, hess)
            self.history.append_record(DE, dq, dq_unit, grad, hess)

        else:
            # Add hypersphere point to the history
            self.history.append(
                self.molsys.geom,
                energy,
                fq,
                self.molsys.gradient_to_cartesians(-1 * fq),
            )
            dq = self.dq_irc(fq, H)
            logger.info("Dq with full precision %s", print_array_string(dq, form=":.6e"))
            fq_tan = self.irc_history._project_forces(fq, self.molsys)
            logger.info("\nTrue forces: %s\nHypersphere forces:%s", fq, fq_tan)
            q_copy = self.molsys.q_array()
            dq, dx, return_str = displace_molsys(
                self.molsys,
                dq,
                fq,
                **self.params.__dict__,
                return_str=True,
                ensure_convergence=self.params.ensure_bt_convergence,
                allow_bend_adjustment=False
            )
            logger.info("IRC hypersphere optimization finished.")

            # Complete history entry of step.
            # Compute gradient and hessian in step direction
            dq_norm, dq_unit, grad, hess = self.step_metrics(dq, fq, H)
            DE = irc_de_projected(dq_norm, grad, hess)
            self.history.append_record(DE, dq, dq_unit, grad, hess)
            self.history.add_linear_bend_record(q_copy, dq, self.molsys)

        self.sub_step_number += 1
        self.total_steps_taken += 1

        if return_str:
            return dq, return_str
        return dq



[docs]
    def converged(self, dq, fq, step_number, str_mode="", **kwargs):
        # This method no longer clears out the history after converging. This reproduces old optking
        # behavior. It is also found that clearing the history negatively impacts hessian updating.

        energies = [step.E for step in self.history.steps]
        fq_new = self.irc_history._project_forces(fq, self.molsys, self.params.linear_algebra_tol)

        if self.sub_step_number < 1 and self.irc_step_number <= 1:
            logger.debug("Too few steps. continue optimization")
            return False

        # Don't allow the guess point to be used to declare convergence
        if self.sub_step_number < 1:
            return False

        # Need to communicate that we want to print an IRC report
        # Need not total_steps_taken but the irc_step_number and sub_step_number
        conv_data = {
            "step_type": "irc",
            "iternum": self.irc_step_number,
            "sub_step_num": self.sub_step_number,
            "energies": energies,
            "dq": dq,
            "fq": fq_new,
        }

        substep_convergence = convcheck.conv_check(
            conv_data, self.params, self.requires(), str_mode=str_mode
        )
        if not str_mode:
            logger.info(
                "\tConvergence check returned %s for constrained optimization."
                % substep_convergence
            )

        if substep_convergence is True:
            self.add_converged_point(fq, self.history.steps[-1].E)
            self.sub_step_number = -1

            # Psi4 has a test that requests exactly one point...
            if self.irc_step_number < 2 and self.params.irc_points > 1:
                return False

            if self.irc_step_number >= self.params.irc_points:
                logger.info(
                    f"\tThe requested {self.params.irc_points} IRC points have been obtained."
                )
                return True

            irc_conv = self.params.irc_convergence
            if self.irc_history.test_for_irc_minimum(fq, energies[-1], irc_conv=irc_conv):
                logger.info("A minimum has been reached on the IRC.  Stopping here.\n")
                return True

            if self.params.irc_mode.upper() == "CONFIRM":
                if self.irc_history.test_for_dissociation(self.molsys, self.orig_molsys):
                    logger.info(
                        "A new fragment has been detected along the reaction path.\n"
                        "IRC is running in 'confirm' mode. Stopping here.\n"
                    )
                    return True

        # Prevent never ending 180 degree passthrough. This occurs in opt-irc-2 in psi4
        if self.sub_step_number > 6:
            linear_bends = [step.crossed_180 for step in self.history.steps]
            flat_list = [bend for bend_set in linear_bends for bend in bend_set]

            for val in flat_list:
                if flat_list.count(val) > 3:
                    self.irc_history.termination_reason = (
                        "Quitting IRC.\n"
                        "One of the bends keeps passing through 180 degrees. Please check the final "
                        "geometry to verify the desired structure has been obtained.\n"
                        "The reported geometry is not guaranteed to be a minimum - please run a "
                        "standard minimization to obtain a true stationary point if desired."
                    )
                    return True

        if self.sub_step_number > 50:
            logger.warning(
                "Exceeded 50 steps in constrained optimization for reaction point %s",
                self.irc_step_number
            )
            raise AlgError(
                "Exceeded 50 iterations for a single IRC point. Check whether the IRC has reached "
                "the desired area of the PES. If not, check that the coordinate system is "
                "reasonable - consider adding or removing coordinates"
            )

        if str_mode:
            return substep_convergence
        return False  # return True means we're finished



[docs]
    def compute_pivot_and_guess_points(self, v, fq, return_str=False):
        """Takes a half step along v to the 'pivot point', then
        an additional half step as first guess in constrained opt.

        Parameters
        ----------
        v : ndarray
            initial vector to step along. Hessian eigenvector for first step. Gradient at subsequent steps

        Notes
        -----
        At the end of function, molsys should correspond to the first guess point. This is where
        properties will be computed
        """

        # Compute and save pivot point
        G = self.molsys.Gmat(massWeight=True)
        N = step_n_factor(G, v)
        dq_pivot = -0.5 * N * self.params.irc_step_size * G @ v

        # revisit
        # Don't allow for displace to fix overstepping 180 for bends here
        # only allowed during the constrained optimization.
        dq1, dx1, return_str1 = displace_molsys(
            self.molsys,
            dq_pivot,
            fq,
            **self.params.__dict__,
            ensure_convergence=self.params.ensure_bt_convergence,
            return_str=True,
            # allow_bend_adjustment=False
        )
        x_pivot = self.molsys.geom
        q_pivot = self.molsys.q_array()
        self.irc_history.add_pivot_point(q_pivot, x_pivot)

        # Step again to get initial guess for next step.  Leave geometry in o_molsys.
        dq2, dx2, return_str2 = displace_molsys(
            self.molsys,
            dq_pivot,
            fq,
            ensure_convergence=self.params.ensure_bt_convergence,
            return_str=return_str,
            print_lvl=self.params.print_lvl,
            # allow_bend_adjustment=False
        )
        # self.molsys.geom = x_guess
        if return_str:
            return dq1 + dq2, return_str1 + return_str2
        return dq1 + dq2



[docs]
    def dq_irc(self, f_q, H_q):
        """Before dq_irc is called, the geometry must be updated to the guess point
        Returns Dq from qk+1 to gprime.
        """

        logger.debug("Starting IRC constrained optimization\n")
        threshold = self.params.linear_algebra_tol  # shortcut

        G_prime = self.molsys.Gmat(massWeight=True)
        G_prime_root = symm_mat_root(G_prime, threshold=threshold)
        # G_prime_inv = symm_mat_inv(G_prime, redundant=True, threshold=threshold)
        G_prime_root_inv = symm_mat_inv(G_prime_root, redundant=True, threshold=threshold)

        logger.debug("G prime root matrix: \n" + print_mat_string(G_prime_root))

        g_M = G_prime_root @ -f_q
        logger.debug("g_M: \n" + print_array_string(g_M))

        # Eq 20 of Gonzalez and Schlegel.
        # Previous bug: G^(1/2) H_q G^(1/2)T
        H_M = G_prime_root @ H_q @ G_prime_root
        logger.debug("H_M: \n" + print_mat_string(H_M))

        # Compute p_prime, difference from pivot point
        orig_geom = self.molsys.geom
        self.molsys.geom = self.irc_history.x_pivot()
        q_pivot = self.molsys.q_array()
        self.molsys.geom = orig_geom
        p_prime = self.molsys.q_array() - q_pivot

        # p_prime = intcosMisc.q_values(o_molsys.intcos, o_molsys.geom) -  \
        #          intcosMisc.q_values(o_molsys.intcos, IRCdata.history.x_pivot())
        p_M = G_prime_root_inv @ p_prime
        logger.debug("p_M: \n" + print_array_string(p_M))

        HMEigValues, HMEigVects = symm_mat_eig(H_M)
        logger.debug("HMEigValues: \n" + print_array_string(HMEigValues))
        logger.debug("HMEigVects: \n" + print_mat_string(HMEigVects))

        # Variables for solving lagrangian function
        lb_lagrangian = -100
        up_lagrangian = 100
        lb_lambda = 0
        if HMEigValues[0] < 0:  # Make lower than the lowest eval
            Lambda = 1.1 * HMEigValues[0]
        else:
            Lambda = 0.9 * HMEigValues[0]
        up_lambda = Lambda

        # Solve Eqn. 26 in Gonzalez & Schlegel (1990) for lambda.
        # Sum_j { [(b_j p_bar_j - g_bar_j)/(b_j - lambda)]^2} - (s/2)^2 = 0.
        # For each j (dimension of H_M):
        #  b is an eigenvalues of H_M
        #  p_bar is projection p_M onto an eigenvector of H_M
        #  g_bar is projection g_M onto an eigenvector of H_M

        lagrangian = self.calc_lagrangian(Lambda, HMEigValues, HMEigVects, g_M, p_M)
        prev_lagrangian = lagrangian

        lagIter = 0
        while lagIter < 1000:
            lagrangian = self.calc_lagrangian(Lambda, HMEigValues, HMEigVects, g_M, p_M)

            if lagrangian < 0 and abs(lagrangian) < abs(lb_lagrangian):
                lb_lagrangian = lagrangian
                lb_lambda = Lambda
            elif lagrangian > 0 and abs(lagrangian) < abs(up_lagrangian):
                up_lagrangian = lagrangian
                up_lambda = Lambda

            if prev_lagrangian * lagrangian < 0:
                break
            prev_lagrangian = lagrangian

            lagIter += 1
            Lambda -= 0.001

        # Calulate lambda using Householder method
        # prev_lambda = -999
        prev_lambda = Lambda
        lagIter = 0
        Lambda = (lb_lambda + up_lambda) / 2  # start in middle of coarse range

        while abs(Lambda - prev_lambda) > 10**-15:
            prev_lagrangian = lagrangian
            L_derivs = self.calc_lagrangian_derivs(Lambda, HMEigValues, HMEigVects, g_M, p_M)
            lagrangian = L_derivs[0]

            h_f = -1 * L_derivs[0] / L_derivs[1]

            # Keep track of lowest and highest results thus far
            if lagrangian < 0 and (abs(lagrangian) < abs(lb_lagrangian)):
                lb_lagrangian = lagrangian
                lb_lambda = Lambda
            elif lagrangian > 0 and abs(lagrangian) < abs(up_lagrangian):
                up_lagrangian = lagrangian
                up_lambda = Lambda

            # Bisect if lagrangian has changed signs.
            if lagrangian * prev_lagrangian < 0:
                current_lambda = Lambda
                Lambda = (prev_lambda + Lambda) / 2
                prev_lambda = current_lambda
            else:
                prev_lambda = Lambda
                Lambda += (
                    h_f
                    * (24 * L_derivs[1] + 24 * L_derivs[2] * h_f + 4 * L_derivs[3] * h_f**2)
                    / (
                        24 * L_derivs[1]
                        + 36 * h_f * L_derivs[2]
                        + 6 * L_derivs[2] ** 2 * h_f**2 / L_derivs[1]
                        + 8 * L_derivs[3] * h_f**2
                        + L_derivs[4] * h_f**3
                    )
                )

            lagIter += 1
            if lagIter > 50:
                prev_lambda = Lambda
                Lambda = (lb_lambda + up_lambda) / 2  # Try a bisection after 50 attempts

            if lagIter > 200:
                err_msg = "Could not converge Lagrangian multiplier for constrained rxnpath search."
                logger.warning(err_msg)
                raise AlgError(err_msg)

        logger.info("Lambda converged at %15.5e" % Lambda)

        # Find dq_M from Eqn. 24 in Gonzalez & Schlegel (1990).
        # dq_M = (H_M - lambda I)^(-1) [lambda * p_M - g_M]
        LambdaI = np.identity(self.molsys.num_intcos)
        LambdaI = np.multiply(Lambda, LambdaI)

        tmp = symm_mat_inv(H_M - LambdaI, redundant=True, threshold=threshold)
        dq_M = -tmp @ (g_M - Lambda * p_M)
        logger.debug("g_M - Lambda p_M %s", (g_M - Lambda * p_M))
        logger.debug("dq_M to next geometry\n" + print_array_string(dq_M))

        # Find dq = G^(1/2) dq_M and do displacements.
        dq = G_prime_root @ dq_M
        logger.info("dq to next geometry\n" + print_array_string(dq))

        return dq


        # TODO write geometry for multiple fragments
        # displace(o_molsys.intcos, o_molsys._fragments[0].geom, dq)


[docs]
    def calc_line_dist_step(self, G_root_inv):
        """mass-weighted distance from previous rxnpath point to new one"""

        rxn_Dq = np.subtract(self.molsys.q_array(), self.irc_history.q())
        # mass weight (not done in old C++ code)
        rxn_Dq_M = G_root_inv @ rxn_Dq
        return np.linalg.norm(rxn_Dq_M)



[docs]
    def calc_arc_dist_step(self, G_root_inv):
        """Let q0 be last rxnpath point and q1 be new rxnpath point. q* is the pivot
        point (1/2)s from each of these. Returns the length of circular arc connecting
        q0 and q1, whose center is equidistant from q0 and q1, and for which line segments
        from q* to q0 and from q* to q1 are perpendicular to segments from the center
        to q0 and q1."""
        qp = self.irc_history.q_pivot(-1)  # pivot point is stored in previous step
        q0 = self.irc_history.q(-1)
        q1 = self.molsys.q_array()

        p = np.subtract(q1, qp)  # Dq from pivot point to latest rxnpath pt.
        dq = np.subtract(q1, q0)  # Dq from rxnpath pt. to rxnpath pt.

        # mass-weight. AH these were not being massweighted as of 0.3.0
        p_m = G_root_inv @ p
        dq_m = G_root_inv @ dq
        p_m = np.multiply(1.0 / np.linalg.norm(p_m), p_m)
        dq_m = np.multiply(1.0 / np.linalg.norm(dq_m), dq_m)

        alpha = acos(abs(p_m @ dq_m))
        arcDistStep = self.irc_history.step_size * alpha / tan(alpha)
        return arcDistStep



[docs]
    def add_converged_point(self, fq, energy):
        G = self.molsys.Gmat(massWeight=True)
        G_root = symm_mat_root(G)
        G_root_inv = symm_mat_inv(G_root, redundant=True, threshold=self.params.linear_algebra_tol)

        q_irc_point = self.molsys.q_array()
        cart_forces = self.molsys.gradient_to_cartesians(fq)
        lineDistStep = self.calc_line_dist_step(G_root_inv)
        arcDistStep = self.calc_arc_dist_step(G_root_inv)

        self.irc_history.add_irc_point(
            self.irc_step_number,
            q_irc_point,
            self.molsys.geom,
            fq,
            cart_forces,
            energy,
            lineDistStep,
            arcDistStep,
        )
        self.irc_history.progress_report()



[docs]
    def calc_lagrangian(self, Lambda, HMEigValues, HMEigVects, g_M, p_M):
        """Calculates and returns value of Lagrangian function given multiplier Lambda."""
        lagrangian = 0

        for val, evect in zip(HMEigValues, HMEigVects):
            numerator = val * evect @ p_M - evect @ g_M
            denom = val - Lambda
            lagrangian += (numerator * denom) ** 2

        lagrangian -= (0.5 * self.params.irc_step_size) ** 2
        return lagrangian



[docs]
    def calc_lagrangian_derivs(self, Lambda, HMEigValues, HMEigVects, g_M, p_M):
        """Calculates and returns value of derivative of Lagrangian function given multiplier Lambda."""
        deriv = np.array([0.0, 0.0, 0.0, 0.0, 0.0], float)

        for val, evect in zip(HMEigValues, HMEigVects):
            numerator = val * evect @ p_M - evect @ g_M
            denom = val - Lambda
            deriv[0] += (numerator / denom) ** 2
            deriv[1] += 2 * (numerator / denom) ** 2 / (denom)
            deriv[2] += 6 * (numerator / denom) ** 2 / (denom**2)
            deriv[3] += 24 * (numerator / denom) ** 2 / (denom**3)
            deriv[4] += 120 * (numerator / denom) ** 2 / (denom**4)

        deriv[0] -= (0.5 * self.params.irc_step_size) ** 2

        return deriv





[docs]
def step_n_factor(G, g):
    """Computes distance scaling factor for mass-weighted internals."""
    return 1.0 / sqrt(g.T @ G @ g)




[docs]
def irc_de_projected(step_size, grad, hess):
    """Compute anticipated energy change along one dimension"""
    return step_size * grad + 0.5 * step_size * step_size * hess